乐玩LEWIN
全部
All
当前位置: 首页 > 新闻资讯 > 谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧
相关新闻
  • 为你提供专业的网络解决方案——乐玩LEWIN

    2026-05-03 17:40

    很多企业在制作完成网站建设后,并没有充分发挥一个网站潜在的能力。在网站建设过程中,我们要从企业品牌塑造、产品特性等多方面进行考量。这样在网站建设完成后,才能让网站帮助企业进行更多的转化率,为

  • 网站建设公司怎么计算费用

    2026-04-19 07:51

    很多用户想做网站建设,却不知道网站建设公司是怎么计算费用的所以迟迟做不成。今天北京网站建设乐玩LEWIN小编跟大家聊聊网站建设公司到底是怎么计算费用的,让没有头绪的客户心里有点数,再去找适合自己

  • 今年各大高校新增“互联网”专业成热门

    2026-04-17 15:04

    下个月要高考了,除了备考,家长和考生很关心的内容是各大高校的专业了。浙江省高校今年新增了66个本科专业,撤销了19个专业,机器人,大数据,互联网等专业成为大热门。那么这些专业到底学习的是什么

  • 网站建设时关键词要怎么选呢?

    2026-04-12 12:08

    选取网站关键词,是网站建设很重要的一点。在网站建设之前,需要对整个网站的结构进行梳理,在设定好网站结构之后,才能有效保证后期的关键词添加能够合理的分布。那么,网站建设时关键词要如何选择呢?看

  • 网站制作你不得不知道的五步!

    2026-04-10 20:55

    为宣传自己企业的品牌文化和产品,大家数企业都想要一个独一无二的网站制作更优于同行,但北京乐玩LEWIN网站制作公司提醒您,在进行设计时一定要懂得网站设计的五不要,才会事半功倍!一、不要浪费时间

谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧

返回列表
发布时间:2026-04-23 14:26
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。
集团网站建设案例

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。