YH533388银河
全部
All
当前位置: 首页 > 新闻资讯 > 谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧
相关新闻
  • 工业互联网5G模组时代的正式到来将为我们带来什么?

    2026-06-09 21:40

    疫情当前,但没有阻止5G相关产品的研发与生产。在全面复工复产的第二周,长虹就传来了好消息,5G工业互联网网站开发模组已于2月20日在爱联科技顺利下线。当全球5G网络网站开发的规模商用,5G

  • YH533388银河带您了解几大类型网站建设的布局

    2026-05-27 22:41

    随着网络的高度发展,网站建设布局是非常重要的,很多人都为此纠结该如何去布局,其实YH533388银河网站建设公司告诉您,网站布局并不像想象的那么难,只要三点就够了。通常北京网站建设布局的常见结构有五大

  • 手把手教你网站建设后如何做好网站备份工作

    2026-05-25 16:19

    网站建设做好上线后,往往会出现各种情况,比如服务器的硬盘崩溃了。您的网站被黑客攻击,黑客删除了您的所有文件。你的网络主机随你的钱和数据消失了。面对这种情况我们应该怎么办呢?YH533388银河网站建设

  • 初期自己做网站需要做好哪些工作

    2026-05-22 15:21

    个人想要建立一个卓有成效的网站不能敷衍了事,随便准备点资料,这是必须要杜绝的!那么在网站建设初期自己要做好哪些准备工作呢?下面让北京做网站公司的工作人员给大家讲解一下。1.网站的发展方向和定

  • 几种常见网站设计的建设类型

    2026-05-18 11:47

    随着互联网网站开发的发展与迭代,全球域名注册数量接近3.5亿。在众多的网站开发中,他们的都是以何种模式运营的,YH533388银河建站小编在此简单总结几大类的网站类型。1、企业官网类企业官网一般包括首

谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧

返回列表
发布时间:2026-06-13 14:17
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。
集团网站建设案例

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。