机器阅读理解(Machine Reading Comprehension)和问答(Questing Answering)是自然语言处理领域的重要方向,可以让人工智能模型阅读文本,并回答与文本相关的问题。
本次比赛的任务为中文阅读理解/问答,选手可以用开源的中文阅读理解数据集(如CMRC、WebQA等)进行训练,同时在验证集和测试集上获得较高的F1分数。验证集和测试集的文本主要来自制造业、智能工业等相关领域。
智慧工业方向(任选其一)
(1)汽车冲压线尾零件缺陷检测
介绍:汽车工厂冲压车间线尾零件表面质检是整车品质管理中非常重要的环节。由于冲压采用批次生产,一旦出现问题容易造成批量不良,返修难度大,直接影响后序焊装、涂装车间的生产和品质。常见冲压零件表面缺陷有缩颈、开裂、起皱、压伤、凸点等。目前对于成品零件的检测依然停留在通过冲压线尾的质检人员目视检测。由于零件缺陷种类各异,标准繁杂,并且这些缺陷往往在普通光照下肉眼难以发现,这对岗位质检人员的经验和能力提出了极高的要求,造成培训周期长,成本高,并且每人对缺陷标准理解不同,也造成检测标准不统一。这种传统的检测方式已经越来越不适用于现代化生产。因此,通过机器学习结合工业相机和光源系统进行自动质检可以取代人工,能够有效减少外界环境干扰、满足生产节拍要求并精准识别出零件缺陷,继而根据AI模型针对零件不同缺陷等级做出正确的反馈。该道工序的自动化可以真正实现冲压线全流程的无人化作业,帮助企业实现提质、降本、增效。
(2)线缆制造排产优化
介绍:线缆制造行业是多品种、混合型、柔性生产行业,国内产业总产值在万亿以上,产值10亿以上企业4000多家。线缆产品类型规格多,单个厂可能存在几百种规格产品,生产调度复杂,排产计划合理性严重影响设备利用率及企业销售接单安排。线缆产品生产方法非常灵活,某些工序可以合并生产做成一根线缆,在后道工序再分开按各自要求制作,使传统的排产调度效果不佳。产品组件较多,且多个层级,物料影响造成计划变更较多,生产受多维度因素影响,插单、换型频繁。传统线缆制造排产方法包括运筹学方法及启发式算法,存在算法复杂度高,运行速度慢,大规模问题中较难应用等问题。应用前面两类方法结合AI机器学习/强化学习类方法,可解决大规模问题及对实时性要求较高的场景,兼顾效果与性能,对生产计划、物料计划等最优解并进行输出,基于需求计划生成准确的周生产计划及产能预警,基于周计划、客户订单和安全库存需求生成准确的日生产计划。从而实现多目标优化综合考量各类指标,尽量减少不必要加班,快速响应需求波动和突发情况,提高生产可控性及生产效率。
(3)AI+ASM模型模拟在污水处理领域的应用
介绍:污水处理涉及物理、化学、生物等多个过程的反应,因此污水处理系统是一个动态、非线性时变的强耦合时滞系统。对污水厂出水水质及时准确的预测,关系到污水厂出水稳定达标与优化运行。通常采用ASM模型预测污水厂处理过程及出水水质,但ASM模型参数众多、进水组分不宜测定、使用过程复杂,影响了出水预测的准确度和及时性。通过建立机器学习模型,构建进水水质、污水厂工艺参数、污水厂出水之间的关系,训练模型并部署。根据进水数据实时动态预测出水水质,并优化曝气与加药过程。
本次竞赛利用无人艇上高清摄像机或光电跟踪仪采集的视频,对常见海面目标进行检测和跟踪。针对检测跟踪任务中面临的目标类别不平衡、目标相互遮挡、目标尺寸小、复杂光照及载体机动等条件下目标关联难度大等问题,构建真实海况场景下的可见光视频序列数据集,开展海面多类目标检测和跟踪研究。
本次竞赛分为线上初赛与线下决赛两个阶段,要求参赛选手们在规定的时间内,设计相应的算法,提交测试结果和技术报告,实现视频序列中海面多类目标的高效检测和稳定跟踪。
自然语言生成旨在让机器能够像人一样使用自然语言进行表达和交互,它是人工智能领域重要的前沿课题,近年来受到学术界和工业界广泛关注。
随着神经网络生成模型特别是预训练语言模型的迅速发展,机器生成文本的可读性和流畅性不断提升。然而,自动生成的文本中依然经常出现不符合原文或背景的错误事实描述,这种生成的事实一致性问题是自然语言生成进行落地应用的主要障碍之一,并逐渐受到研究学者的关注。鉴于当前国内外关于事实一致性的生成评测比赛十分匮乏,为了促进自然语言生成的技术发展和实际应用,我们组织了面向事实一致性的生成评测比赛。
在此比赛中,我们将提供三个对事实一致性有较高要求的生成任务,包括文案生成、摘要生成和问题生成。同时,在系统评价中,我们将结合文本流畅性和事实一致性两项指标综合评估参赛生成系统的水平。通过这样的任务设定和评价方式,此评测将有助于研究者和开发者更多关注自然语言生成的事实一致性难题,并为大家提供学术交流平台,从而进一步提升自然语言生成的研究水平,推动相关技术的应用发展。
为深入贯彻落实科教强鲁人才兴鲁战略,服务人才培养和创新省份建设,围绕为推进实施国家大数据战略,进一步落实国务院《关于促进大数据发展行动纲要》(国发[2015]50 号)以及 2022 年国务院关于印发“十四五”数字经济发展规划的通知(国发〔2021〕29号)“数字经济是继农业经济、工业经济之后的主要经济形态,是以数据资源为关键要素,以现代信息网络为主要载体,以信息通信技术融合应用、全要素数字化转型为重要推动力,促进公平与效率更加统一的新经济形态。
本赛项旨在结合当前大数据行业中技术要求,通过大赛让参赛选手熟悉一个大数据项目中各个环节的实现过程。通过竞赛来检验教学水平,引领和促进职业教育教学改革,促进山东与世界最新水平接轨,营造崇尚技能的社会氛围。