• 疫情背景下旅游出行预测
  • 通信信用风险评估

一、初赛

1、初赛要求提交《模型说明文档》和测试结果,《模型说明文档》内容请参考以下格式:

一、模型设计

说明建模方案和整体技术架构,包含模型算法、超参设置、特征维度等概要内容。

二、建模过程

具体介绍特征工程,算法选择等各阶段的主要技术、方法、流程。

三、效果评估

使用常见模型评估指标如查准、查全、F1值评估测试集,不同处理方法的性能对比及增益分析等。

《模型说明文档》提交的标准格式为PPT/PDF格式。也可补充提供能证实研究成果的其他支持材料,如音视频文件,可执行文件等(非必须)。测试结果提交的文件格式为csv格式。

2、初赛评选规则

初赛根据模型方案质量和预测效果综合评分,择优进入决赛。

二、决赛

1、进入决赛的团队将使用安徽移动大数据开放平台所提供的移动海量真实数据,进行模型调优,并根据调优过程进一步完善《模型说明文档》,提交最终测试结果和《模型说明文档》。

2、进入决赛的团队需要在安徽移动大数据开放平台提交csv格式的测试结果和可执行源代码,根据预测效果指标得分排名。

随着新冠肺炎疫情在我国进入常态化防控阶段,旅游业也开始逐步复苏。国庆中秋双节来临在即,出行需求有望进一步释放。与此同时,随着智能手机和移动互联网的普及,运营商积累了来自用户的海量数据,比如漫游、位置信令等。

本赛题以安徽移动用户数据为基础,参赛队伍需要通过大数据和算法构建用户省内游出行意向模型。希望参赛队伍能够挖掘数据背后丰富的内涵。

1、数据说明

本赛题除了可使用公共数据集外,还提供用户轨迹和出行行为数据。

轨迹数据,表名为Dataplus_Travel_Train_Trail,包括如下字段:

user_id 用户标识 抽样&字段脱敏
come_time 进入时间 粒度到分钟
leave_time 离开时间 粒度到分钟
longitude 经度(WGS84) 字段脱敏,保留小数点后3位
latitude 纬度(WGS84) 字段脱敏,保留小数点后3位
poi_tag 是否省内4A级以上景区 0:否1:是
poi_name 省内4A级以上景区名称

用户出行行为数据,表名为Dataplus_Travel_Train_User,包括如下字段:

user_id 用户标识 抽样&字段脱敏
in_flag 省内游出行意向 0:无出行意向; 1:有出行意向

2、任务描述

训练数据部分:

本赛题提供一定量的用户在3个月时间之内的轨迹数据(6.11~9.11),以及未来10天(9.12~9.21)的出行行为数据。

公共数据集提供用户3个月的基础信息,以及在3个月时间之内(6.11~9.11)的通话、轨迹和上网行为数据。

选手从数据中自行组成特征和数据格式,自由组合训练测试数据比例。

3个月的轨迹

预测数据部分:

2020-9-12到2020-9-21日用户的省内游出行意向。

为保护用户的隐私和数据安全,所有数据均已进行了采样和脱敏。

数据中部分列存在空值或NULL,请参赛者自行处理。

评分数据格式:

参赛者完成对用户省内游出行意向预测之后,需要将结果放入指定格式的数据表

(非分区表)中,要求结果表名为:Dataplus_Travel_Predict,格式同Dataplus_Travel_Train_User,要求去除重复。

3、数据文件

初赛数据

初赛阶段提供10000个用户的完整行为数据。其中7000用户用于训练,3000用户用于预测。

决赛数据

决赛阶段提供30万用户的完整行为数据。其中21万用户用于训练,9万用户用于预测。

本赛题目标是预测用户省内游出行意向,将使用安徽移动用户历史出行数据作为评估测试数据,采用经典的精确度(precision)、召回率(recall)和F1值作为评估指标。具体计算公式如下:

其中PredictionSet为算法预测的出行行为,ReferenceSet为真实的出行行为。以F1值作为最终的唯一评测标准。

保密协议请点击下载

协议下载

一、初赛

1、初赛要求提交《模型说明文档》和测试结果,《模型说明文档》内容请参考以下格式:

一、模型设计

说明建模方案和整体技术架构,包含模型算法、超参设置、特征维度等概要内容。

二、建模过程

具体介绍特征工程,算法选择等各阶段的主要技术、方法、流程。

三、效果评估

使用常见模型评估指标如查准、查全、F1值评估测试集,不同处理方法的性能对比及增益分析等。

《模型说明文档》提交的标准格式为PPT/PDF格式。也可补充提供能证实研究成果的其他支持材料,如音视频文件,可执行文件等(非必须)。测试结果提交的文件格式为csv格式。

2、初赛评选规则

初赛根据模型方案质量和预测效果综合评分,择优进入决赛。

二、决赛

1、进入决赛的团队将使用安徽移动大数据开放平台所提供的移动海量真实数据,进行模型调优,并根据调优过程进一步完善《模型说明文档》,提交最终测试结果和《模型说明文档》。

2、进入决赛的团队需要在安徽移动大数据开放平台提交csv格式的测试结果和可执行源代码,根据预测效果指标得分排名。

随着互联网金融的发展,以大数据为依托的征信已经成为互联网行业和金融行业的新兴市场,可以预计,随着电信运营商介入大数据征信,所掌握的海量数据将和一些金融机构的风控能力有效结合,未来个人消费者使用手机的消费数据、通信交往记录、使用业务的情况、位置信息、消费能力等等都将关系到个人信用评价,也会影响到未来个人的银行贷款、就业和商业交往。

安徽移动已经给用户提供不同金额的欠费信用额度,还不断推出多种组合的人性化的服务,用户不必为紧急情况下欠费停机而担心。本赛题针对使用运营商信用透支用户,从不同的维度对用户的信用表现进行预测。

1、数据说明

本赛题除了可使用公共数据集外,还提供用户停机数据和违约行为数据。

停机数据表名为Dataplus_Credit_Train_Stop,包括如下字段:

user_id 用户标识 抽样&字段脱敏
stop_days 当月停机总天数
stop_cnt 当月停机总次数
date 数据日期 泛化,精度到月份

违约行为数据表名为Dataplus_Credit_Train_User,包括如下字段:

user_id 用户标识 抽样&字段脱敏
risk_flag 违约标识 0:未违约;1:违约

2、任务描述

训练数据部分:

本赛题提供2020年5-7月用户的停机数据,以及部分用户在未来一个月(2020年8月)的违约行为(欠费导致停机)数据;

公共数据集提供用户3个月的基础信息,以及在3个月时间之内(6.1~7.31)的通话、轨迹和上网行为数据。

选手从数据中自行组成特征和数据格式,自由组合训练测试数据比例。

预测数据部分:

预测用户在2020年8月是否会违约。

数据中部分列存在空值或NULL,请参赛者自行处理。

为保护用户的隐私和数据安全,所有数据均已进行了采样和脱敏。

评分数据格式:

参赛者完成对用户违约行为预测后,需要将结果放入指定格式的数据表(非分区表)中,要求结果表名为:Dataplus_Credit_Predict,格式同Dataplus_Credit_Train_User,要求去除重复。

初赛数据

初赛阶段提供10000个用户的完整行为数据。其中7000用户用于训练,3000用户用于预测。

决赛数据 决赛阶段提供70万用户的完整通话行为数据。其中50万用户用于训练,20万用户用于预测。

本赛题采用经典的精确度(precision)、召回率(recall)和F1值作为评估指标。具体计算公式如下:

其中PredictionSet为算法预测的违约数据集合,ReferenceSet为真实的违约数据集合。以F1值作为最终的唯一评测标准。

保密协议请点击下载

协议下载
基于报名参赛团队的选题与承办单位所属分公司的客户资源,报名参赛企业应与承办单位所属分公司双向选择、合作组队,共同构建“接江淮地气”的创新应用。参赛团队中的承办单位所属分公司为参赛企业提供脱敏通信行业样例数据获取、处理、验证、口径解释等数据支撑。

本次大赛积极鼓励参赛团队利用赛事开放通信行业大数据、交通行业政府数据构建大数据类应用,也可使用互联网爬取数据、自带数据等作为有益补充。

通信行业大数据包括客户标签、终端信息、通信消费信息、终端位置轨迹、手机上网登录级内容、社交数据等;交通行业政府数据包括道路设施、交通管理等数据。

大赛主办方对初赛阶段主要提供通信行业大数据、交通行业政府数据种类说明、提供数据字典、少量脱敏样例数据等支持,鼓励优先使用通信行业数据、交通行业政府数据。参赛团队可根据数据字典、样例数据等模拟生成数据进行演示,也可使用互联网爬取数据、自带数据作为补充。

对进入决赛应用主办方将提供原型系统所需统计数据等支持。

提供统计数据以系统现有实际能力为限,且提供统计数据需经过信息安全审核,因此一般需通过双方沟通过程确认。

一、提交材料

1、初赛:

(1)《保密协议》扫描件一份

《保密协议》 打印出签字,提交签字后扫描件(jpg、pdf均可)。

(2)作品方案文档一份

要求提交创意方案,包括作品整体介绍、解决问题分析、设计方案、数据使用方案、方案价值论述等。

2、决赛

决赛阶段要求在初赛方案基础上增加原型系统开发情况及应用落地计划(如何产生商业价值或社会价值)两项内容。

二、提交方式

通过电子邮件,按上述要求,将全部提交材料以压缩包形式提交至应用创新赛组委会邮箱(bigdataah_zq@139.com),邮件主题为“应用创新赛+应用名+企业名称+联系人+联系人手机号”,联系人信息请与报名信息保持一致。

保密协议请点击下载

协议下载