多模态AI重新定义人机交互方式
未来的多模人工智能(AI)什么样?想象一下,只需简单一个指令,新定它们便能领悟并执行复杂的义人任务;它们还能通过视觉捕捉用户的表情和动作,判断其情绪状态。机交这不再是互方好莱坞科幻电影中的场景,而是多模正逐步走进现实的“多模态AI”。 据美国《福布斯》网站近日报道,新定元宇宙平台公司、义人OpenAI以及谷歌公司等巨头,机交都推出了各自的互方多模态AI系统,正不遗余力地加大对此类系统的多模研发投资,力求提高各种模态内容输出的新定精确度,从而改善AI与用户的义人交互体验。 多模态AI标志着一种范式变革。机交它将深刻改变很多行业的互方面貌,并重塑数字世界的格局。 赋予AI“多重感官”功能 人类是如何了解世界的?我们依赖视觉、听觉和触觉等多种感官,从无数来源接收信息。人脑将这些纷繁复杂的数据模式融合,绘制出一幅生动的现实“画卷”。 IBM公司官网这样定义多模态AI:能集成和处理来自多种模态(数据类型)的机器学习模型,这些模态包括文本、图像、音频、视频等形式的输入。就像赋予AI一整套感官,使它能从多个角度感知并理解输入的信息。 这种跨越不同模态理解和创建信息的能力,超越此前侧重于集成和处理特定数据源的单模态AI,赢得了各大科技巨头的青睐。 在今年的移动通信大会上,高通公司将其开发的多模态大模型首次部署在安卓手机上。用户无论是输入照片,还是语音等信息,都能与AI助手顺畅交流。例如,用户可以拍一张美食照片向AI助手提问:这些食材都是什么?能做出什么菜?每道菜的热量是多少?AI助手能基于照片信息,给出详细的答案。 今年5月,OpenAI发布了多模态模型GPT-4o,其支持文本、音频和图像的任意组合输入和输出。随后,谷歌也于第二天推出了自己的最新多模态AI产品Gemini 1.5 Pro。 9月25日,元宇宙平台公司发布了其最新的开源大语言模型Llama 3.2。公司首席执行官马克·扎克伯格在主题演讲中表示,这是该公司首个开源多模态模型,可同时处理文本和视觉数据,标志着AI在理解更复杂应用场景方面取得了重大进展。 悄然推动各领域变革 多模态AI正悄然改变着多个领域的面貌。 在医疗保健领域,IBM旗下“沃森健康”正对病人的影像学数据、病历文本和基因数据进行综合分析,帮助医生更准确地诊断疾病,有力支持医生为病人制订个性化治疗方案。 创意产业也正在经历一场变革。数字营销专家和电影制片人正借助这一技术打造定制内容。试想,只需一个简单的提示或概念,AI系统就能编撰出引人入胜的剧本,生成故事板(即一系列插图排列在一起组成的可视化故事)、创作配乐,甚至制作出初步场景剪辑。 教育和培训领域也在多模态AI助力下向个性化学习迈进。美国纽顿公司开发的自适应学习平台能利用多模态AI,深入分析学生的学习行为、表情和语音,实时调整教学内容和难度。实验数据显示,这种方法能将学生的学习效率提高40%。 客户服务也是多模态AI系统令人兴奋的应用之一。聊天机器人不仅能回应文本查询,还能理解客户的语调,分析客户的面部表情,并用适当的语言和可视化线索作出回应。这种更接近人类的交流有望彻底改变企业与客户的互动方式。 仍需克服技术伦理挑战 但多模态AI发展也面临诸多挑战。 AI咨询公司“隐空间”创始人亨瑞·艾德尔表示,多模态AI的强大之处在于能够整合多种数据类型。然而,如何有效整合这些数据仍是一个技术难题。 此外,多模态AI模型在运行过程中往往需要消耗大量算力资源,这无疑增加了其应用成本。 更值得注意的是,多模态数据包含更多个人信息。当多模态AI系统能轻松识别人脸、声音乃至情绪状态时,如何确保个人隐私得到尊重与保护?又该如何采取有效措施,防止其被用于创建“深度伪造”或其他误导性内容?这些都是值得深思的问题。
-
上一篇
-
下一篇
- 最近发表
-
- 卵形拟杆菌具有抗肾纤维化作用
- 【影評】《奇異博士2:失控多重宇宙》:命運交響曲與母愛真偉大,導演山姆雷米巧思致敬驚悚名片
- 歐盟「戒斷」俄羅斯能源有腹案,加速天然氣脫俄成最大挑戰,怎麼做到?
- 《每日郵報》引述保守黨議員說法,稱英國工黨副領袖學莎朗史東盤腿「分散首相注意力」
- 烯酰吗啉标准品:农药分析与科研必备
- 在德國選舉,甚少有候選人把中學成績放在政綱和個人簡介裡
- 【未來大人物】鴨仔蛋吃太多成貶義語?族裔斜槓者劉千萍:我是新二代也是舊八代,我是百分百台灣人
- 【書評】《黑暗年代的女哲學家》(下):「女性」作為哲學家,與男性為什麼、有什麼不同?
- 防患未然!旅行突發狀況解決錦囊
- 鴻海研究院執行長李維斌:AI塑造的環境就像是廚房,駭客蟑螂找到價值就會攻擊
- 随机阅读
-
- 整改是否到位?陕西宝鸡对抽检不合格食品生产企业跟踪检查
- 《溝通分析心理學經典2【人生腳本】》:童年性騷擾事件與「小紅帽」腳本的關聯
- 美眾議院長裴洛西抵達基輔會面澤倫斯基,感謝烏克蘭為自由而戰
- 世界銀行預估大宗商品漲價到2024年,經濟學人:新興經濟體恐陷入「失落的十年」
- 俄羅斯稱打擊烏防空系統 烏克蘭稱襲擊俄軍彈藥庫
- 《黑暗騎士崛起》:提姆波頓的主要貢獻,在於將復仇電影的三幕劇結構引入《蝙蝠俠》
- 腰圍過粗、血壓偏高等五大危險因子中三個以上,小心「代謝症候群」!
- 俄羅斯反戰民眾上街抗議被捕,荒唐的是警方不知道該指控什麼罪名
- 外交部:中方就管控仁愛礁局勢同菲方達成臨時性安排
- 歷時13年南橫5月1日將全線通車:道路管制、入山申請一次看
- 《毛姆文學課》導讀:因著個人閱讀偏好,讀者可以進入不同的毛姆世界,這正是本書迷人之處
- 越破爛越貴!巴黎世家推出一雙台幣5.5萬元的「仿舊帆布鞋」成網路最新話題
- 湯告魯斯獲邀出席巴黎奧運閉幕式 表演Mission Impossible
- 《黑暗騎士崛起》:提姆波頓的主要貢獻,在於將復仇電影的三幕劇結構引入《蝙蝠俠》
- 馬提斯《學會領導》:即使我們努力表達想合作,2009年我們已預見到——俄羅斯將會成為新的威脅
- 中國與索羅門群島簽署安全合作協議,擺明在南太牽制美澳援台的戰略意圖
- 润康生态:守护土壤健康,助力农作物提质增效丨广东农企品牌价值50强评选巡礼
- 立院投票通過總統提名任檢察總長,邢泰釗:「有溫度的司法」是未來努力目標
- 學校不給你看的,這裡都有:美國公共圖書館發放「我讀禁書」借書證
- 比起將話語權交給律師的安柏赫德,親上火線的強尼戴普如何逆轉輿論風向?
- 搜索
-
- 友情链接
-