点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:多模态AI重新定义人机交互方式
首页> 网安频道> 隐私保护 > 正文

多模态AI重新定义人机交互方式

来源:科技日报2024-10-23 18:03

  未来的人工智能(AI)什么样?想象一下,只需简单一个指令,它们便能领悟并执行复杂的任务;它们还能通过视觉捕捉用户的表情和动作,判断其情绪状态。这不再是好莱坞科幻电影中的场景,而是正逐步走进现实的“多模态AI”。

  据美国《福布斯》网站近日报道,元宇宙平台公司、OpenAI以及谷歌公司等巨头,都推出了各自的多模态AI系统,正不遗余力地加大对此类系统的研发投资,力求提高各种模态内容输出的精确度,从而改善AI与用户的交互体验。

  多模态AI标志着一种范式变革。它将深刻改变很多行业的面貌,并重塑数字世界的格局。

  赋予AI“多重感官”功能

  人类是如何了解世界的?我们依赖视觉、听觉和触觉等多种感官,从无数来源接收信息。人脑将这些纷繁复杂的数据模式融合,绘制出一幅生动的现实“画卷”。

  IBM公司官网这样定义多模态AI:能集成和处理来自多种模态(数据类型)的机器学习模型,这些模态包括文本、图像、音频、视频等形式的输入。就像赋予AI一整套感官,使它能从多个角度感知并理解输入的信息。

  这种跨越不同模态理解和创建信息的能力,超越此前侧重于集成和处理特定数据源的单模态AI,赢得了各大科技巨头的青睐。

  在今年的移动通信大会上,高通公司将其开发的多模态大模型首次部署在安卓手机上。用户无论是输入照片,还是语音等信息,都能与AI助手顺畅交流。例如,用户可以拍一张美食照片向AI助手提问:这些食材都是什么?能做出什么菜?每道菜的热量是多少?AI助手能基于照片信息,给出详细的答案。

  今年5月,OpenAI发布了多模态模型GPT-4o,其支持文本、音频和图像的任意组合输入和输出。随后,谷歌也于第二天推出了自己的最新多模态AI产品Gemini 1.5 Pro。

  9月25日,元宇宙平台公司发布了其最新的开源大语言模型Llama 3.2。公司首席执行官马克·扎克伯格在主题演讲中表示,这是该公司首个开源多模态模型,可同时处理文本和视觉数据,标志着AI在理解更复杂应用场景方面取得了重大进展。

  悄然推动各领域变革

  多模态AI正悄然改变着多个领域的面貌。

  在医疗保健领域,IBM旗下“沃森健康”正对病人的影像学数据、病历文本和基因数据进行综合分析,帮助医生更准确地诊断疾病,有力支持医生为病人制订个性化治疗方案。

  创意产业也正在经历一场变革。数字营销专家和电影制片人正借助这一技术打造定制内容。试想,只需一个简单的提示或概念,AI系统就能编撰出引人入胜的剧本,生成故事板(即一系列插图排列在一起组成的可视化故事)、创作配乐,甚至制作出初步场景剪辑。

  教育和培训领域也在多模态AI助力下向个性化学习迈进。美国纽顿公司开发的自适应学习平台能利用多模态AI,深入分析学生的学习行为、表情和语音,实时调整教学内容和难度。实验数据显示,这种方法能将学生的学习效率提高40%。

  客户服务也是多模态AI系统令人兴奋的应用之一。聊天机器人不仅能回应文本查询,还能理解客户的语调,分析客户的面部表情,并用适当的语言和可视化线索作出回应。这种更接近人类的交流有望彻底改变企业与客户的互动方式。

  仍需克服技术伦理挑战

  但多模态AI发展也面临诸多挑战。

  AI咨询公司“隐空间”创始人亨瑞·艾德尔表示,多模态AI的强大之处在于能够整合多种数据类型。然而,如何有效整合这些数据仍是一个技术难题。

  此外,多模态AI模型在运行过程中往往需要消耗大量算力资源,这无疑增加了其应用成本。

  更值得注意的是,多模态数据包含更多个人信息。当多模态AI系统能轻松识别人脸、声音乃至情绪状态时,如何确保个人隐私得到尊重与保护?又该如何采取有效措施,防止其被用于创建“深度伪造”或其他误导性内容?这些都是值得深思的问题。(科技日报记者 刘霞)

[ 责编:刘昊 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 习近平会见印度总理莫迪

  • 贵州从江:侗寨禾晾“晒秋”引客来

独家策划

推荐阅读
10月22日,在南泥湾,“弘扬延安精神 奋进伟大时代”网上主题宣传媒体团采访南泥湾,齐声合唱经典曲目《南泥湾》,在歌声中,我们仿佛看到了昔日的开荒景象,感受到了那份自力更生的坚韧精神。一曲《南泥湾》,唱出了对美好生活的向往。
2024-10-23 17:03
入驻延安新材料产业园的延安市圣烯科技股份有限公司,研发的这款马甲借助石墨烯良好的热传导性能,只要插上充电宝就能实现发热取暖。入驻延安新材料产业园的延安市圣烯科技股份有限公司,研发的这款马甲借助石墨烯良好的热传导性能,只要插上充电宝就能实现发热取暖。
2024-10-23 16:55
“这么小个头的苹果树竟然能长出那么大的苹果!”10月22日,“弘扬延安精神 奋进伟大时代”网上主题宣传走进延安市安塞区南沟村,调研采访南沟村的苹果产业现代化发展之路,有记者在看到矮砧密植的苹果树后,直呼意外。
2024-10-23 16:47
土生土长的延安娃陈凯凯,在他的不懈努力下蜕变为“菇”勇者,小小香菇带着周围的村民们走出延安,产品走出国门,奔向新生活。
2024-10-23 16:44
当秋天降临延安,山川绚丽多彩。甘泉县的延安劳山国家森林公园宛如一幅绝美的秋之画卷。这里有丰富的野生植物和野生动物,是“植物王国”和“天然氧吧”。快来邂逅秋日美景!
2024-10-23 16:39
在历史的长河中,陕西延安富县藏着一条古人的“高速路”——秦直道。它承载着千年的沧桑与辉煌,见证了无数的风云变幻。千里秦直道,最美在富县,让我们一同踏上这片古老的土地,追寻历史的足迹,感受那穿越时空的魅力。
2024-10-23 16:36
一块面团,一双巧手,几经揉捏,几笔勾画,上锅蒸熟后,面团变成了花卉、动物的样式。黄陵面花在黄陵延续了上千年的历史,体现了当地人对美好生活的向往。
2024-10-23 16:33
延安小杂粮种植面积达 40.65 万亩,预估产值 52 亿元,从业人口 10.7 万人,“延安小米”品牌价值达 27.69 亿元。昔日滋养革命的小杂粮,如今正引领着延安乡村振兴之路越走越宽,持续哺育着延安的振兴发展。
2024-10-23 16:29
“荒山秃岭都不见,疑似置身在江南。只缘退耕还林好,一路青山到延安。”这首流传在百姓间的打油诗,描述着今日的延安景色。在延安市吴起县南沟村,抬头看,满目青山,低头看,碧水汪汪,很难想象这是坐落在陕北的小山村。在过去的近30年里,这个小山村实现了从“一棵树”到“一片林”的蜕变。荒山披上“绿衣”,怎么做到的呢?
2024-10-23 16:25
延安精神,是我们党宝贵的精神财富,是激励我们不断前进的强大动力。
2024-10-19 16:29
近日,何超琼在参加“弘扬延安精神 奋进伟大时代”网上主题宣传访谈时表示,自己期待有一天能够走进延安,感受“绿满山川成锦绣”,聆听历史的回声,见证时代的发展,汲取前行的力量。
2024-10-19 16:33
延安精神跨越时空、历久弥新,激励着一代又一代共产党人奋勇前行,为全面建成社会主义现代化强国、实现中华民族伟大复兴的中国梦提供强大精神动力
2024-10-19 16:20
陆嘉伟:讲好新时代延安故事,探寻延安各行业发展新变化,展示人民群众生活新图景
2024-10-18 19:00
“人民医护工作者”国家荣誉称号获得者路生梅:回望党中央在延安13年的奋斗故事,展望新时代延安焕发的勃勃生机,让我们共同关注“弘扬延安精神 奋进伟大时代”网上主题宣传。
2024-10-20 18:38
都说延安的木刻版画,刀锋下满是家国情怀,这是因为它们曾在战争时期,被当作强有力的宣传武器。
2024-10-20 18:25
10月19日,“弘扬延安精神 奋进伟大时代”网上主题宣传媒体团记者们到访延安,第一次踏上这片红色热土的他们,热血沸腾。
2024-10-20 18:12
10月20日晚,“弘扬延安精神 奋进伟大时代”网上主题宣传即将在延安启动。
2024-10-20 18:12
10月19日,“弘扬延安精神 奋进伟大时代”网上主题宣传媒体团到访延安红秀,偶遇秧歌腰鼓民歌。
2024-10-20 17:44
近日,何超琼在参加“弘扬延安精神 奋进伟大时代”网上主题宣传访谈时表示,延安苹果以其卓越的质量和独特风味,赢得了香港和澳门民众的广泛喜爱。延安苹果进入大湾区的市场,成为两地经贸合作的一个生动例证。(剪辑:李晓鹏)
2024-10-19 21:49
陕西文旅推荐使者 冯佳晨:延安精神拥有跨越时空的力量、永恒不变的价值。开启新征程、奋进新时代,弘扬延安精神,争做新时代好青年。让我们一起参与“弘扬延安精神 奋进伟大时代”网上主题宣传。
2024-10-19 21:48
加载更多