科大讯飞出手,人机·真·交互时代来了!!!

雷科技,2025-06-12 23:03:14

这两三年,国内外科技巨头们都在摩拳擦掌,倾尽资源布局,试图在AI技术革命中占据先机。

仔细想想,似乎大部分厂商在做的事情都很直白,也很简单,那就是通过海量数据的预训练,让大模型拥有十八般武艺,知识问答、文案创作、数学题解答、逻辑推理等等,几乎能够轻松应对所有问题。

有趣的是,像这类几乎“无所不能”的大模型,却大多数都只有一种交互方式——“提问”。

你提问,它回答,就这么简单。事实上,在今年开年火遍全国的DeepSeek就是一个相当不错的例子。

在这个大模型技术如雨后春笋般涌现的时代,智能硬件的人机交互显然也来到了一个发展的关键节点。

2025年6月12日,科大讯飞在深圳举办智能交互产品升级发布会,基于最前沿的人工智能技术,围绕智能交互场景,开放全新平台技术能力,发布企业级智能体创新引擎,并推出十大场景化标杆解决方案,助力合作伙伴创造出真实的业务价值。



(图源:科大讯飞)

说得更简单一点,在最新发布的AI交互技术和机器人超脑平台的加持下,讯飞不仅试图让我们与机器的“交流”的方式变得更加简单、流畅,更希望能让机器去完成更多的工作,而不是像现在这样,把一身能力全都限制在简单的“对话”里头。

或许有朝一日,“I,Robot”的剧情,真的会在现实中上演。

别提问,我们来交流吧

在开始之前,我想问大家一个简单的问题。

在你看来,“交互”是什么?

在我看来,所谓人机“交互”,是指人与各种硬件之间通过特定界面和操作方式进行信息交换、传递指令、接收反馈并共同完成特定任务的过程。

上个世纪70-80年代,人们需要通过DOS命令和计算机你来我往;图形化界面的诞生,让更多的人能够方便地使用计算机完成各种任务;移动通信的发展,让触屏手机成为我们随身携带的必备品;而智能硬件的茁壮成长,似乎让语音成为了这个时代最自然的交互方式之一

但真的是这样吗?

事实上,只要用过现在智能硬件语音交互的人,几乎是随手就能抛出一大堆问题,先不论需要关键词唤醒和一问一答的交互方式到底有多拖沓,经常出现的回答滞后、语音识别不准等现象,更是会让无效操作频繁发生,而限制颇高的语音指令,也很难让你去灵活调用各种设备进行调节。

像这样的人机交互,显然是不够理想的。

那么问题来了,万物互联时代,所谓的AI交互应该是什么样子?

嗯……首先,最起码你听说能力得到位吧。



(图源:科大讯飞)

为了“听清楚”,讯飞打造了从多麦克风阵列降噪收音到线性双麦、四麦、6麦的多模态降噪技术,再有专为户外移动场景降噪设计的3麦降噪方案,即便佩戴智能眼镜在骑行、工地等嘈杂环境下,仍能精准识别语音指令;不仅如此,通过其AIUI等核心技术,讯飞将语音交互变得像人人交互一样畅快自然,简单说一句“我回家了”,系统就能瞬时地自动执行预设的灯光开启、空调调至舒适温度、窗帘拉开等一系列动作。

嫌交互太呆板?这次讯飞实现了全双工超拟人交互,彻底打破了传统“一问一答”的刻板模式。这就好比我们人与人之间的自然交谈,可以在对方说话的同时插话并被理解共鸣。



(图源:科大讯飞)

例如,在智能家居场景中,当设备正在播报信息或播放音乐时,用户可以直接插话发出新的指令,如“声音再大一点,然后切到下一首”,设备能够连贯地理解并执行这一系列指令,使得交互过程如行云流水般顺畅。

其次,仅仅能听会道也不够,更高级的交互需要机器具备“理解”的能力,尤其是理解言语之外的深层含义。



(图源:科大讯飞)

观察目前市面上绝大多数的人机交互系统,你会发现它们普遍缺乏有效的记忆机制和情感理解能力。这意味着设备记不住用户此前的操作习惯、个人偏好以及历史对话内容,也无法准确识别用户当前的情绪状态,整个交互过程显得非常生硬、机械。

为此,科大讯飞在情感与个性化交互层面大力投入,致力于让机器交互更有“人情味”。

现在,通过深入分析用户的语音语调、语速变化等声学特征,系统能够敏锐地感知用户的情绪状态,甚至能够适配儿童独特的表达逻辑和不规范发音,并智能匹配相应情感的语音合成进行交互。

即便是宝宝牙牙学语的声音,也能够换来温柔、安抚的回应。



(图源:科大讯飞)

不仅如此,为了实现更深层次的个性化交互,讯飞还构建了包含上下文理解、用户画像沉淀和生活事件记录的三层记忆体系。这使得设备能够“记住”用户的习惯与偏好,让智能办公软件记住用户的写作习惯,聊天陪伴软件能提供更个性化、更连贯的陪伴体验,更能搭配智能穿戴设备,持续获取健康建议和各种提醒。

豁,听上去还真不赖。

值得一提的是,上面所介绍的这些AI交互能力的进化,不仅会深刻改变我们在智能家居、智能穿戴等消费级场景的应用体验,更为机器人领域实现全新的人机交互升级奠定了坚实的基础。

随着具身智能技术的发展,各式陪伴机器人,教育机器人,服务机器人层出不穷,人与机器人之间的交互已经演变为机器人和人工智能技术发展的重点研究方向之一,其交互的自然性、智能性和协作性直接决定了机器人的应用广度和深度。

其中比较标志性的,就是这款搭载了讯飞机器人超脑平台能力的人形机器人。



(图源:科大讯飞)

通过深度整合机器人超脑平台套件,数字华夏的人形机器人在语音交互能力上实现了质的飞跃,不但在复杂环境下也拥有着出色的语音识别能力,还创新性地通过多模态降噪技术解决了多人交互场景下的识别难题。

同时,平台集成的AIUI系统,使机器人具备了更深层的语义理解能力和知识运用能力。在此基础上,数字华夏自研情感表达系统与情感计算系统,使仿人机器人在颜值、智商兼备的同时,也拥有相当的情商。

在发布会现场,讯飞还展示了一项新的技术。



(图源:科大讯飞)

藉由讯飞超脑平台部署“即插即用”的智能语音背包,这样就能在不改造硬件本体的情况下,赋予宇树机器人语音交互能力,进一步打通人与机器人的交互逻辑。

目前,和讯飞达成合作的机器人客户已有500多家,他们都在致力于通过软硬件一体化的快速集成,实现机器人能听会说、能理解会行动的未来。

讯飞AI交互的技术能力,必然会在具身智能高阶发展阶段充分释放。

虚拟人、智能体,样样在行

在这次大会上,讯飞还带着大家一起回顾了一些技术里程碑:

2010年,讯飞发布了全球首个同时提供语音合成、语音搜索、语音听写等智能语音交互能力的移动互联网智能交互平台——“讯飞语音云”,意图让移动互联网应用像人一样“能听会说”,让输入繁琐的短信书写和在线聊天更加便捷有趣。

2015年,讯飞推出的以自然语言理解为核心的全链路人机交互平台——“AIUI开放平台”,这次不仅要“能听会说”,讯飞更希望快速让传统设备也加入“能听会说,能理解会思考”的行列,为智能硬件人机交互带来了体验跃迁。

2023年,“讯飞星火认知大模型”横空出世,作者本人也亲历了星火大模型的多个版本迭代,亲眼见证了全国产算力的认知智能大模型是怎样走到今天的,随后,与之配套的应用、产品、技术平台更是不断涌现。

比如虚拟人



(图源:科大讯飞)

当然了,站在2025年中,没人会对虚拟数字人感到陌生,随手打开的电商平台,爸妈爱刷的短视频应用,甚至楼下大爷都能和你聊几句他在银行看到的虚拟客服。

不过,讯飞的虚拟人和那些“AI感”拉满的同类还真不大一样,依托星火大模型的虚拟人交互平台,不仅拥有着最新的AI虚拟形象技术,更结合了业界领先的语音识别、语义理解、语音合成、自然语言处理(NLP)以及星火大模型等AI核心技术栈,可以轻松打造出适合展厅导览、智能客服、员工培训、在线面试等一众场景的高质量虚拟人。

近年来热度持续不低的智能体领域,科大讯飞也进行了深度布局。

其核心是讯飞星辰Agent平台,这是一个低门槛、一站式的大模型精调与智能体构建平台,不仅支持讯飞星火全系列大模型,还广泛兼容如DeepSeek、Qwen3等业界主流的开源大模型,模型的使用和推理成本也很理想,旨在助力企业高效构建专属大模型和智能应用。



(图源:科大讯飞)

依托于此,讯飞也提供了一系列功能强大的智能体应用。

例如专注于AI内容创作的“讯飞绘文”,它能提供从选题分析、内容生成到多平台发布及数据优化的全链路支持;原生AI文档工具“讯飞智文”,能够轻松完成从大纲构建、内容提炼到排版设计的PPT初稿生成,还有讯飞智作、讯飞绘镜等,基本上已经涵盖了从文档处理、数据分析、视频制作、社交互动等在内的全场景办公需求。

能不能学会灵活应用这些东西,很可能成为新时代打工人的必备技能。

当然,还有更重要的,那就是其AI能力输出和生态构建的核心载体——讯飞开放平台



(图源:科大讯飞)

自讯飞星火正式发布以来,讯飞开放平台已新增超过453.6万开发者,其中大模型直接相关的开发者数量超过148.1万,企业级用户超过88.5万。海外开发者团队数51.8万。

最后不得不提的是由科大讯飞发起并持续举办的AI开发者大赛,如今这项赛事已经成为一个全球性的人工智能竞赛平台,来自全球各地的人工智能产业的专业人才积极参与,共同推动人工智能前沿科学的研究和创新成果的实际转化。

根据@奇异因子调查统计,讯飞是目前市面上应用布局最广、产品矩阵最多元的厂商之一,目前,讯飞旗下已有三款应用突破百万月活大关,讯飞星火4.0成为了2025斯坦福MixEval-Hard评测中唯一进入前十的中文大模型,企业中标数据更是力压群雄,足见其在AI领域的技术积淀与创新实力。



(图源:知乎@奇异因子)

正所谓一家独大不是春,唯有生态的繁荣,才能创造AI更广阔的未来。

大模型时代,交互将被如何重构?

如今,“大模型”就像当年的“互联网”,给予整个市场无限想象力。

在大模型的热潮之下,许多产业都值得被重塑一遍,其中就包括消费电子、家用电器、机器人、汽车等领域。大模型技术不应成为一个简单的问答工具,这些领域的消费者都理应享受到深度智能交互所带来的畅快感,而这正是科大讯飞希望通过这场发布会带来的东西所实现的。

当前的智能家居市场,尽管发展仍然迅速,但用户体验却存在诸多痛点和窘境。许多所谓的智能家居产品,其“智能”程度往往名不副实,设备间的互联互通性差,操作复杂,语音助手反应迟钝、理解能力有限,常常出现“人工智障”的情况,就像是一堆需要分别控制、指令刻板的“智能”单品。

在我看来,这种交互体验上的落差,正是行业亟待突破的瓶颈。

机器人同样是未来的重要趋势。

尤其是人形机器人的前景非常可观,据《人形机器人产业研究报告》预测,2024年中国人形机器人市场规模将达到约27.6亿元,到2029年达到750亿元,将占世界总量的32.7%,占比位居世界第一。

机器人超脑的一系列核心能力,能够明显提升机器人面对复杂任务时的应答和处理能力;融入AI交互技术之后,更是能进一步提升人形机器人在真实场景下的多模态感知与理解能力,实现以人为中心的深度智能协作。

如今,科大讯飞正成为智能家居、智能穿戴和多种机器人领域落地的首选。

或许机器人那边还要等一等,但现在智能硬件正值一波以旧换新潮,如果能将这些产品与讯飞AI交互技术结合,就能够为用户创造更智慧的家居生活,也能为家电厂商、技术提供商带来新的增长点。

有趣的是,如果你对科大讯飞的了解更深一点,你会发现他们的整个发展思路,早在大模型还没有苗头的时候就定下来了。

“让机器像人一样能听会说、能理解会思考,用人工智能建设美好世界”,这可是讯飞在2014年提出的公司使命。

从20多年前让机器能听会说,到10多年前让机器能理解会思考,再到现如今通过大模型赋能千行百业,试图重塑人机交互新生态,科大讯飞在人工智能领域完成一次次跨越,成为一股敢为人先的国产科技力量。

可以预见的是,随着记忆、推理和多模态能力的进步,未来机器人将通过自监督学习不断优化自身,减少对人为干预的依赖,通过其智能化和个性化的服务处理更复杂的办公流程,甚至代替你直接完成某些繁琐而重复的工作。

届时,科大讯飞或许真的会彻底重构我们的人机交互方式。

而剩下的问题,就要让时间帮我们印证了。