9月1日,上海迎来第五届世界人工智能大会。全球人工智能领域的顶尖科学家、各国政府代表、各界知名企业家再次齐聚,共同探讨智能时代的美好图景。其中,徐汇区政协委员徐立、乔宇、杨万强全面深度参与这场AI盛会,在各自擅长的领域中与与会专家做了深入探讨,带我们了解人工智能的奇妙世界。
徐立委员:人工智能为宇宙探索增加新维度
在大会开幕式“星辰大海与脚踏实地”现场对话环节中,徐汇区政协常委、商汤科技董事长兼CEO徐立博士作为人工智能领域的科学家代表,受邀与清华大学苏世民书院院长、清华大学人工智能国际治理研究院院长薛澜教授,中国天眼FAST首席科学家李菂教授,中国载人航天工程总设计师周建平院士,展开一场横跨宇宙、打破认知边界的对话,生动、深入地讨论了AI技术对人类探索宇宙的积极作用和长远价值。
人工智能引发的范式创新,将帮助人类更好地开展对于天文观测、探索宇宙等未知领域的研究。
对话中,徐立博士提到,在强大算力的支持下,人工智能可以自行从庞大的存量天文数据中发掘规律,给出打破人类认知边界的重要突破。当前,很多基础科学的迭代演进,已经在人工智能的推动下进入了新的阶段,正在反向指导人类的发展。
进一步来看,人工智能还有望为人们对宇宙的探索引入新的测量尺度,增加新的认知维度。每一次测量尺度的拓展,都意味着基础定律的刷新,从而引发对世界认知的变迁。
事实上,从模拟控制核聚变到模拟宇宙大爆炸,从预测蛋白质结构到推演生命基础分子,今天的人工智能已在很多领域取得了令人惊叹的成果,拓展了人类已有的知识维度,使人类看到了更远的未来,但是,当下的人工智能仍不足以取代天文观察和航空飞行,帮助人类实现对宇宙的终极认知。徐立认为,探索宇宙的主体是人而不是机器,而人类的认知特点决定了,需要人类通过自身一步步的实验和探索,才能够逐步形成清晰的认识和理解。
宇宙探索是人类共同的事业,需要长期的国际合作。李菂教授认为,人类拥有同一片天空,无论采用何种技术,科学家们的总体目标非常统一,在很多共性挑战问题上持续保持着高效和高容量的合作。
周建平院士也提到,国际上每个天文望远镜的观测重点和技术特点都不尽相同,大家通过协同合作就可以充分发挥优势,让人们更准确地了解宇宙,为天文学的发展和进步做出更多贡献。
李菂教授和周建平院士均表示,探索宇宙是人类的共同梦想,这项活动中,全球不同国家和地区都可以交流合作,共享科技成果。
当前,人类发展依然面临诸多挑战,在诸如天文探索等领域,人工智能可以发挥更多积极作用。徐立表示,天文是一项寂寞的科学,和人工智能一样都需要大量和长期积累,但在这个过程中,随着更多数据规律的不断发现,将产生更多创新,由此把人们对于世界和宇宙的认知引入到一个全新界面上,让人类距离最终梦想越来越近。
放眼未来,随着科学技术和社会文明水平的不断进步,人们在对宇宙和地外文明进行长期探索的同时,也在加深对人类社会自身的认知与理解。
乔宇委员:能理解视频和做翻译的“书生2.0”来了!
图说:“书生2.0”在40多种图像和视频任务中取得领先性能
2022世界人工智能大会科学前沿全体会议期间,上海人工智能实验室发布了更为通用的人工智能模型“书生2.0”。全新升级后的“书生”,不但“看图更准”,还学会了“理解视频”和“做翻译”,四十多个视觉任务取得了世界领先性能,以中文为核心的大规模百语翻译开源平台也将在年内推出。
“实验室正在打造以视觉和自然语言为核心的通用模型技术体系,包括基础理论方法、数据集、模型集、下游任务和应用生态等。”徐汇区政协委员、上海人工智能实验室领军科学家乔宇表示,“面向未来,‘书生’期望实现以一个模型谱系完成上千种任务,体系化解决人工智能发展中的诸多瓶颈问题。推动人工智能从单任务单模态可用到多任务多模态安全易用,从感知智能到认知智能的跃迁。”
视觉模型更通用、更低碳、更环保
发展更为通用的AI技术是人工智能的科技前沿和核心焦点问题。去年11月,上海人工智能实验室发布“书生”,一个模型即可全面覆盖分类、目标检测、语义分割、深度估计四大视觉核心任务。将通用视觉技术体系命名为“书生”,意在体现其如同书生一般的特质,可通过持续学习,举一反三,逐步实现通用视觉领域的融会贯通,最终实现灵活高效的模型部署。经过近一年的努力,“书生2.0”全新升级,可以更加精准地识别图像,在图像标杆任务上性能取得了显著的提升,并在三十多种视频任务上取得了领先的性能,还可实现以中文为核心的百种语音翻译。
“书生2.0”通用图像模型基于动态稀疏卷积网络,可以根据不同的视觉任务自适应地调整卷积的位置以及组合方式,从而灵活准确适配不同的视觉任务。相较于“书生1.0”,“书生2.0”在图像检测等视觉标杆任务上的性能取得重大提升。以卷积神经网络的方式重新取得图像领域标杆任务的领先性能,也为图像大模型提供了新的方向。
“书生2.0”通用视频模型探索掩码学习和对比学习相结合的训练范式,突破视频自监督学习的性能瓶颈,构建了首个具有体系化动态感知能力的视频大模型,全面覆盖基础视频识别、开放视频感知、时空语义解析三大核心领域。在视频识别、视频时空检测、视频时序定位、视频检索等三十多种视频任务上精度世界领先。
基于“书生2.0”的通用图像和视频模型,可以广泛应对多种视觉任务和多种场景。在12大类40余种视觉任务中,“书生2.0”模型支撑取得了领先性能,超越了相关领域的国际知名机构。
在达到优异性能的同时,“书生2.0”还实现了使用成本更低、更低碳、更环保的目标。相比达到谷歌的CoCa和微软的SwinV2-G的相似效果,“书生”使用的计算量远远小于前两者。
推出以中文为核心的百语翻译模型
目前大部分开源翻译模型在中文和其他语种之间的翻译时错误率较高。针对这个痛点,“书生2.0”积累了大量中文为核心的翻译数据,提出了异步多分枝训练技术,构建了以中文为核心的百语通用翻译模型,一个框架支持161种语言,推动中文自然语言处理社区的开放。
M2M和NLLB是公认开源效果领先的多语言翻译模型。在Flores数据集上,对比M2M 120亿参数量模型,“书生2.0”在多语到中文的平均翻译性能提升了35.1%;对比NLLB 500亿参数量模型,“书生2.0”在多语到中文的平均翻译性能提升了7.1%。而相较前两者,“书生2.0”仅需要10亿的推理参数。以“书生”技术为支撑,团队在Waymo自动驾驶等16项国际大赛和评测中取得了冠军,发表了20余篇高质量学术论文并开源,稳步构建以视觉和自然语言为核心的更为通用的人工智能技术体系。
本次大会期间,由中国电子技术标准化研究院、上海人工智能实验室联合发起,多家机构共同编撰的全国信标委人工智能分委会的第一份技术文件《人工智能大规模预训练模型 第1部分:通用要求》(TC28/SC42-001)也即将发布。该文件是模型开发者、科研机构、模型使用方、第三方评测机构共同研讨的重要成果,作为我国大模型领域的一份奠基性规范文件,对推动大模型与产业深入融合、完善生态具有重要意义。
杨万强委员:金融数字化过程中的风险防控
数字化时代,金融服务的模式和业态在变,但金融业务的核心依然是管理和经营风险。徐汇区政协委员、上海复深蓝软件股份有限公司董事长兼总经理杨万强(以下简称“杨”)在“金融数字化过程中的风险防控”圆桌讨论中,聚焦金融数字化过程的风险防控,从AI的金融应用场景和监管科技等不同角度,探讨金融数字化风控。
AI风控在不同金融场景中的应用
问:您如何看待知识图谱、深度学习等人工智能技术在保险等金融行业中的应用前景?例如,如何通过AI手段帮助保险公司防范骗保。
杨:人工智能技术在保险等金融行业有着非常广泛的应用场景,随着近年来人工智能相关技术日趋成熟,随着相关行业和机构的数字化水平的不断提升,未来将有越来越多可以实现AI落地的场景。在保险反欺诈领域,以往使用基于统计算法和机器学习的模型进行风险管控,相关方案和技术已经相对成熟。现在我们基于深度学习和知识图谱等更新的AI技术的方案推出和应用,取得了更大突破。比如我们使用了多模态保险数据分析与处理的方式来处理风控问题。应用结构化数据、半结构化数据、图片文本等非结构化数据、知识图谱等图数据,来协同推理。在车险反欺诈中,分析历史赔付时发现,大量车险骗保都属于团伙作案。而作案都有类似的规律:相同或相似的场地、相同或相似的被撞物、作案时间相近、有关联的人员等等。但在进行理赔报案时,报案人员会用不同的人员,采用不同的表述方式提供报案信息,用不同的拍照方式和角度提供照片。对这种团体骗保的方式,如果仅仅采用常见的结构化数据进行数据建模,是不容易发现的。基于这种规律,我们采用了结构化数据结合目标检测、以图搜图、自然语言编程等的AI技术,对场地去除车辆、人员干扰后,快速搜索找到相同相似的场地。并通过对报案信息进行NLP物体归类,并匹对三者物体检测模型得到被撞物。在海量文本处理中,使用注意力掩码机制,解决海量文本处理的噪音问题,让文本处理更加精确。最后通过使用向量搜索引擎让系统性能在海量图像、海量文本搜索情况下仍然可以在一两秒内找到风险案件。
除了这种基于非结构化数据的风控反骗保行为,我们还可以使用知识图谱等相关AI技术对投保的投保人、受益人进行风险识别。保险欺诈往往会涉及复杂的关系网,使用图结构来捕获投保人、受益人和相关风险人的关联,把他们的显性关系直观地展示出来,可以帮助快速找到潜在的高风险保单。知识图谱技术还可以结合图计算、图存储技术的前沿技术,比如图特征处理和融合技术、深度学习图模型技术、时序有向环检测技术,更可通过强大的推理挖掘功能,找到实体之间的隐性关系,并通过不一致性校验找到犯罪分子瞒天过海的蛛丝马迹。以此进行深度分析,实现精准反欺诈。
数字化风控水平的评价标准
问:金融机构数字化管理和风控水平的评价标准是什么?可否有一些量化指标或模型来分类评级?
杨:保险行业的核心价值就是对被保人的未来的风险提供保障,风控就是保险行业的核心。保险行业拥有强大的风控体系。一家保险公司经营得好还是不好,其中一个核心评价指标就是这家保险公司的风控水平做得好不好。量化衡量保险行业的风控指标有很多,常见的偿付能力风险指标、赔付率、预期赔付率等。偿付能力风险监管指标主要包括:核心偿付能力充足率、综合偿付能力充足率、风险综合评级三种。
随着保险行业数字化转型升级的推进,除了这些偏业务的指标和标准外,很多企业和机构也非常关注保险行业的数字管理水平、风控体系评估标准和能力模型。2022年初,人民银行、银保监会相继发布《金融科技发展规划(2022-2025 年)》和《关于银行业保险业数字化转型指导意见》,提出“加快数字经济建设,全面推进银行业保险业数字化转型,推动金融高质量发展,更好服务实体经济和满足人民群众需要”。随着互联网金融平台的普及以及商业银行业务线从传统零售向数字化转型,金融服务线上化发展已成趋势。为此,手机银行等细分领域已经先行一步,开始制定了相关标准。《手机银行数字化服务能力要求》标准文稿是由中国信息通信研究院牵头,由多家业内机构共同参与编制的。而针对保险行业的数字化风控还没有一个共同的评价标准和能力评估模型,但随着保险行业和监管部门对风控的要求越来越高,保险行业需要在数字化风控对数据对接处理能力管理能力、实时动态报表数据看板、技术开发框架层、算力管理镜像管理、算法模型的支持和能力提供层等领域有更高的要求和更直观和量化的评估标准。因此我们相信保险数字化风控体系会在未来一段时间内,也会由权威部门起草和制定相关的数字化风控评估标准,对包含对保险等金融企业在数字化风控方面投入的预算规模、硬件和网络设施安全评估、相关技术人员的水平认证、系统开发和运维规范性等方面提供评估标准和具体指标。
评论留言