CCF大数据与计算智能大赛(CCF Computing Intelligence Contest,简称CCF BDCI)是由中国计算机学会大数据专家委员会于2013年创办的国际化智能算法、创新应用和大数据系统大型挑战赛事,是全球大数据与人工智能领域最具影响力的活动之一。2019 CCF大数据与计算智能大赛由教育部高等学校计算机类专业教学指导委员会、国家自然科学基金委员会信息科学部及郑州市人民政府指导,中国计算机学会主办,郑州市郑东新区管理委员会、教育部易班发展中心、CCF大数据专家委员会、大洋洲计算机研究与教育协会、数联众创承办。
2019年,第七届CCF BDCI大赛不忘初心,以“数据驱动,智创未来”为主题,以前沿技术与应用问题为导向,立足国际化、规模化,创造公平竞技环境,打磨赛练同擂模式,致力提升技术应用水平,为社会发现和培养高质量数据人才,推动大数据产学研生态发展。
二、项目内容
(1)基于OCR的身份证要素提取
出题单位:兴业银行股份有限公司
技术方向:分类预测 数据挖掘
任务描述:设计针对商业银行身份证识别的OCR系统,识别身份证中姓名、地址、身份证号码和身份证有效日期等信息。
(2)承用车细分市场销量预测
出题单位:深瞳云涂
技术方向:预测回归 数据挖掘
任务描述:要求参赛者根据给出的32款车型,在15个细分市场的24个月销量数据,建立销量预测模型,预测同一款车型和相同细分市场在接下来连续4个月份的销量。
(3)互联网金融新实体发现
出题单位:国家互联网应急中心
技术方向:命名实体识别 自然语言处理
任务描述:要求参赛者从提供的金融文本中识别出现的位置金融实体,包括金融平台名、企业名、项目名称及产品名称。
(4)“技术需求”与“技术成果”项目之间关联度计算模型
出题单位:八六三软件
技术方向:关系挖掘自然语言处理
任务描述:要求参赛者发现好的方法、算法或模型,应用于平台模拟人工,实现“需求——成果只能匹配服务”。
(5)基于大数据的查询优化
出题单位:阿里云
技术方向:性能优化 数据库
任务描述:给定数据集,三张表customer、lineitem和orders,分别行数为150000,600037902和150000000.输入参数为多个变参组合,要求对每个组合,都能给出正确的结果。
(6)三角形图计算算法设计及性能优化
出题单位:服务计算技术与系不统教育形重点实验室&费马科技
技术方向:性能优化 图计算
任务描述:在给定服务器平台,以及数据集上实现三角形计数(Triangle Counting,TC)算法,调试并获取最高的性能。三角形的定义是一个包含三个顶点的子图,其中顶点两两相连。
(7)企业网络资产及安全事件分析与可视化
出题单位:奇安信
技术方向:数据可视化 数据挖掘
任务描述:近期某企业重要系统被攻击,导致重要数据发生泄漏,请基于该企业内部正常网络日志数据,给出可视化分析,对企业内部的网络资产之间的通信模式,对该网络安全事件的攻击过程进行描述。
(8)离散制造过程中典型工件的质量符合率预测
出题单位:西门子
技术方向:分类预测 数据挖掘
任务描述:要求参赛者对给定的工艺参数组合,所产生工件的质检标准符合率进行预测。
(9)金融信息负面及主体判定
出题单位:国家互联网应急中心
技术方向:情感识别 自然语言处理
任务描述:要求参赛者根据训练模型,判定金融文本中是否包含金融实体的负面信息,若包括,判断负面信息的主体对象是实体列表中的哪些实体。
(10)视频版权监测算法
出题单位:爱奇艺
技术方向:目标识别 图像处理
任务描述:要求参赛者找到短视频的原始长视频,计算出对应的时间段,过程中可能包括视频解码抽帧、视频或图像特征及指纹、视频相似检索等相关计算及技术方案。
(11)互联网新闻情感分析
出题单位:中移软件
技术方向:自然语言处理 机器学习
任务描述:要求参赛者在庞大的数据集中,精准地区分文本的情感极性,情感分为正中负三类。
(12)多人种人脸识别
出题单位:蚂蚁金服
技术方向:性能优化 人脸识别
任务描述:要求结合一个给定的模型(InsightFace),提高该模型在一个给定人种上面的人脸识别性能。
(13)海口市-交通流量时空演变特征可视分析
出题单位:滴滴出行
技术方向:数据可视化 数据挖掘
分析2017年5月1日-10月31日海口市的交通需求情况及出行变化最显著的3个特征。根据上述数据分析,为市民或城市交通管理部门提供建议。
(14)赛题名称:新人入门训练赛
中国人民大学:《时间序列多步预测》
中国人民大学:《GPU连接优化技术》
中科院计算所:《文本实体识别及关系抽取》
太远理工大学:《新闻文本中的事件检测》
重庆邮电大学:《阿尔茨海默病的识别》
重庆邮电大学:《O2O商铺食品安全相关评论发现》
基金会中心网:《慈善领域舆情情感分析》
三、赛程赛制
·2019/08/17 启动仪式,发布赛题,开放报名
·2019/08/17-2019/10/25 大赛初赛,可持续报名
·2019/08/23 开放数据下载及作品评测
·2019/10/26-2019/10/29 截止报名,复赛入围资格审核
·2019/10/30-2019/11/11 大赛复赛,更换数据或调整赛题,可持续参与评测
·2019/11/12-2019/11/22 作品提交截止,决赛入围资格审核
·2019/11/23-2019/11/24 大赛决赛,答辩评审及颁奖典礼
四、报名方式
2019-09-26