2024年3月5日 人工智能领域(AI)信息差

人工智能
后台-插件-广告管理-内容页头部广告(手机)

谷歌的ScreenAI可以像人类一样“看”图像

谷歌研究介绍了ScreenAI,这是一个视觉语言模型,可以对数字图形内容(如信息图表、插图和地图)进行问答,同时还可以注释、总结和导航用户界面。该模型结合了计算机视觉(PaLI架构)和图像的文本表示,以处理这些多模态任务。

尽管参数仅为46亿,但ScreenAI在基于用户界面和信息图表的任务上取得了新的最先进结果,并在其他任务上表现出了最佳性能,与类似规模的模型相比。

 

虽然ScreenAI在某些任务上表现出色,但仍需要进一步研究才能与规模更大的GPT-4和Gemini等模型匹敌。谷歌研究发布了一个包含ScreenAI统一表示的数据集和另外两个数据集,以帮助社区在与屏幕相关的任务上进行更全面的基准测试实验。

ScreenAI在统一的视觉和语言理解方面取得突破,弥合了人类和机器在文本、图像、图表等方面解释思想的差距。公司现在可以利用这些多模态能力来构建总结报告、分析仪表板可视化生成见解以及控制工作流程的助手的助手。

AI“蠕虫”如何在连接系统中构成安全威胁

安全研究人员创建了一个名为Morris II的人工智能“蠕虫”,旨在展示人工智能生态系统中的漏洞。在这个系统中,不同的人工智能代理被链接在一起,以自主完成任务。

研究人员使用ChatGPT、Gemini和其他流行的人工智能工具,在模拟电子邮件系统中测试了这个“蠕虫”。该蠕虫可以利用这些人工智能系统从电子邮件中窃取机密数据,或未经人类批准转发垃圾邮件/宣传信息。它通过注入对抗性提示,使人工智能系统表现出恶意行为。

尽管这次攻击是模拟的,但研究突显了如果人工智能代理被赋予过多不受监管的自由来运作,可能存在的风险。

这次人工智能“蠕虫”攻击揭示了像ChatGPT这样的生成模型已经达到需要加强安全性以防止滥用的能力。研究人员和开发人员在商业发布之前必须优先考虑安全性,通过内置控制和风险监控来确保安全。在没有全行业对负责任人工智能的承诺的情况下,随着系统获得更多自主权,可能需要立法来强制执行跨关键领域的可接受保障。

新的基准测试方法挑战了大型语言模型(LLM)的推理能力。

Consequent AI的研究人员发现了类似GPT-3.5和GPT-4这样的大型语言模型中存在的“推理差距”。他们引入了一种名为“功能变体”的新基准测试方法,该方法旨在测试模型的推理能力,而不仅仅是记忆能力。这种方法涉及将数学问题等推理任务转化为需要相同逻辑来解决的独特问题的代码。

 

在评估几种最先进的模型时,研究人员发现已知基准测试问题和模型需要进行推理的新问题之间存在显著差距。这一差距为58-80%,表明这些模型并不真正理解复杂问题,而可能只是存储训练示例。这些模型在更简单的数学问题上表现更好,但仍然显示出推理能力的局限性。

这项研究揭示了推理仍然超出了我们最先进的人工智能的能力。如果大科技公司的基准测试奖励表面技巧而不是实际的批判性思维,我们就有被其进步声明误导的风险。未来,模型创建者将不得不优先考虑泛化和逻辑而不是记忆,如果他们想要朝着通用智能取得有意义的进展。

其他消息

人工智能或许能够实现个性化前列腺癌治疗

研究人员利用人工智能分析前列腺癌的DNA,发现了两种不同的亚型,被称为“进化型”。识别这些亚型可以更好地预测患者的预后并实现个性化治疗。

Vimeo 推出面向商业合作的人工智能视频中心

Vimeo 推出了一个名为 Vimeo Central 的新产品,这是一个由人工智能驱动的视频中心,可帮助公司改善内部视频通信、协作和分析。关键功能包括集中式视频库、人工智能生成的视频摘要和亮点、增强的屏幕录制和视频编辑工具,以及强大的分析功能。

摩托罗拉为即将推出的 AI 动力 Moto X50 Ultra 手机做准备

摩托罗拉正在为即将推出的 Moto X50 Ultra 手机制造轰动,发布了一个以 F1 为主题的预告视频,突出了该设备强大的人工智能功能。该手机将于4月21日首先在中国推出,然后可能以摩托罗拉 Edge 品牌在全球发布。

Copilot 将很快获取并解析您的 OneDrive 文件

微软即将推出 Copilot for OneDrive,这是一个人工智能助手,可以总结文档、提取信息、回答问题,并执行与存储在 OneDrive 中的文件相关的命令。Copilot 可以根据文档生成大纲、表格和列表,以及定制的摘要和回复。

⚡ 华为的新人工智能芯片威胁到英伟达在中国的主导地位

华为推出了一款新的人工智能芯片 Ascend 910B,根据 SemiAnalysis 的评估,其性能与英伟达的 A100 GPU 相匹配。Ascend 910B 已经被百度和讯飞等中国主要公司采用,由于美国对英伟达最新人工智能芯片的出口限制,它可能从英伟达手中夺取中国市场份额。

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。