2024年4月15日-4月26日,国际电信联盟标准化局第16研究组(SG16)在法国雷恩召开了全体会议。由思必驰主导,联合中国信息通信研究院、中国电信提出的车载多音区语音交互国际标准(Framework and requirement for in-vehiclemulti-regionintelligent speech interaction system/车载多音区语音交互系统的框架与要求),在本次会议中进行了讨论,并正式获批立项。这也是在该领域中,首个由中国公司牵头制定的新一代汽车语音交互国际标准。
关于ITU-T SG16
ITU为三大国际标准化组织之一,ITU-T即国际电信联盟电信标准分局 (ITU-T for ITU Telecommunication Standardization Sector), 是ITU管理下的专门制定电信标准的分支机构。ITU-T SG16是国际电信联盟标准化局非常活跃的研究组,主要研究领域为多媒体与e-Services。目前,SG16的研究范围覆盖了视频与音频处理与压缩编码、视频监控、内容分发、大数据、区块链、人工智能等众多热点标准化研究方向。
盖世汽车研究院数据显示,2023年车载语音交互渗透率达78.8%,相较于2022年提升5个百分点,其中免唤醒、连续识别、分区唤醒、可见即可说、声纹识别等新一代语音交互相关功能的搭载率均有明显提升。不同于以往单纯的语音识别,新一代的高阶语音交互逐渐成为新时代汽车的标配。
然而语音交互技术的实现链路较长,在智能座舱环境下更甚,不仅包括语音交互技术的全链路衔接、硬件选型,还涉及到与车机系统、应用层、云端处理等环节的适配。当前汽车产业链国际化趋势越来越高,跨国企业的不同部门、汽车企业与科技企业的研发团队往往分属于不同的国家和地区。车载语音交互系统的国际标准不统一,可能会在跨地域合作的过程中造成系统集成和技术升级的适配问题,从而影响项目实施的效率与效果。
本次《车载多音区语音交互系统的框架与要求》国际标准将围绕车载多音区语音交互系统的语音输入、语音识别、语义理解、语音合成、语音输出、智能决策及系统对接等功能提出技术能力要求。通过规范智能座舱中高阶语音交互链路中各个环节的输出质量与标准,以提高技术团队对接效率,从而推进产品体验的提升以及全球技术的无障碍交流。
作为本次国际标准的牵头单位之一,思必驰在对话式人工智能全链路方面具有完整的技术创新体系和工程系统研发能力,拥有近100项全球独创技术,已授权知识产权近1500件,在多个国际性赛事上屡次夺冠,并率先攻克了车载座舱条件下的“鸡尾酒会难题”,实现了车内不同座位的乘客可以同时与车载助理对话交互,而互相之间毫无影响,该项技术引领了车载智能座舱技术的变革。截止到目前,思必驰已累计牵头/参与制定了近70项国家级/行业级/团体级标准,推动人工智能语音语言技术的规范化发展和应用。
2019年,思必驰正式开启汽车前装业务。截至目前,思必驰已合作近60家汽车品牌,其中包括比亚迪、上汽通用五菱、长城汽车、北汽新能源、极氪汽车、哪吒汽车等中国前十大自主品牌,量产车型已超过160款,累计“上车”量超过1000万。
2022年,思必驰汽车语音交互方案通过中国信通院可信AI评测,并获得L9级智能认证,是国内目前已知的最高车载语音交互产品的智能等级认证。
2023年,盖世汽车研究院《智能汽车HMI产业发展趋势》数据显示,根据上险量统计,思必驰语音上车增速第一,高达38%。
2024年,思必驰升级大模型技术全场景方案应用,并开启出海战略,在汽车领域,一方面加大与海外车企的本土化合作,一方面伴随中国新能源车企“走出去”。最近,思必驰参与编制的国内首个汽车大模型标准也正式发布,聚焦汽车行业高质量发展,助推汽车大模型产品升级优化。
“一带一路”倡议下,中国汽车工业走出去的战略步伐越来越快,中国车企、技术企业与海外伙伴之间的合作越来越紧密。车载多音区语音交互国际标准的制定,一方面将填补该领域的空白;另一方面,将为车载语音交互的技术能力及软硬件接口提供标准化的要求,促进国际间的技术交流与合作,助力汽车产业全球化发展!
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。