谷歌开发多物种鲸鱼声音识别 AI 模型,助力海洋学术研究

据谷歌新闻稿,谷歌公司正持续投入资源开发一种能够识别鲸鱼声音的 AI 模型。最新的多物种鲸鱼声音模型能够识别 8 种鲸鱼的叫声,并进一步细分其中两种鲸鱼的不同发声类型。看来,谷歌不仅在搜索引擎上游刃有余,在海洋研究上也是 “鲸” 益求精。

AI 模型的应用与合作

谷歌表示,这项技术主要用于海洋学术研究,能够帮助科研团队获取布氏鲸等 “较难以观察的” 鲸群行为模式。目前,该模型已公开供学术人员下载使用。科研人员们再也不用 “望鲸兴叹”,只需点击一下即可获取强大的声音识别工具。

自 2018 年以来,谷歌便与美国国家海洋和大气管理局(NOAA)的太平洋群岛渔业科学中心合作,展开鲸鱼叫声分类的研究。最初,他们针对座头鲸开发了检测模型,成功辨识座头鲸的鸣叫声,从而掌握了相关鲸群在特定时间地点的活动规律,还意外发现了新栖息地。

谷歌还与加拿大渔业及海洋部(DFO)及 Rainforest Connection 合作,针对濒临灭绝的南方定居型虎鲸开发了一系列检测模型,并将其应用于水下麦克风监测网络,能够实时报告虎鲸的位置给 DFO 和相关单位。简直是 “鲸” 细到位,保护行动一气呵成。

多物种声音识别与技术细节

如今,谷歌的鲸鱼声音识别模型可以识别包括座头鲸、虎鲸、蓝鲸、长须鲸、小须鲸、布氏鲸、北大西洋露脊鲸和北太平洋露脊鲸在内的八种鲸鱼的声音。考虑到鲸鱼声音覆盖的频率范围极广(例如蓝鲸发声为 10 Hz 的低频、齿鲸发声为 120 kHz 的高频),该模型在科研层面可谓创举。

在开发这款鲸鱼声音识别模型时,研究人员首先将原始音频转换为时频谱(Spectrogram)以作为模型识别声音的基础,其中每个时间窗包含 5 秒钟的声音片段。接着,模型利用梅尔刻度法调整这些时频谱的声音频率,并通过压缩和正则化突出声音特征,进而将其分类为不同鲸鱼的鸣叫类别。这个过程就像是给鲸鱼的声音 “拍照”,然后用智能技术进行 “身份认证”。

由于海洋中存在各种声音干扰,研究人员还加入了大量背景声音来训练模型,以确保能够准确识别鲸鱼声音并排除噪音。实验结果显示,该模型能够良好地区分不同种类的鲸鱼声音,特别是在识别小须鲸和布氏鲸的声音方面表现尤为出色。这意味着科学家们可以更加精准地追踪这些鲸鱼的活动,进一步了解它们的行为模式。

研究总结与未来展望

谷歌公司提到,这款鲸鱼声音识别模型的开发和评估展示了其在面对不同终端用户时增强临床实践和提供个性化、数据驱动的支持的潜力。这就像是为海洋生物研究量身定制了一套智能化解决方案,让鲸鱼管理变得更加轻松和高效。

未来,谷歌的鲸鱼声音识别模型有望进一步拓展其应用范围,成为海洋研究领域的 “全能冠军”,为更多科研人员和环保机构带来福音。谷歌还计划继续与各大科研机构和环保组织合作,推动这项技术在全球范围内的应用和推广,为保护海洋生物多样性和实现可持续发展贡献力量。

通过这一系列努力,谷歌不仅展示了其在科技创新方面的领先地位,也彰显了其对环境保护和社会责任的承诺。相信在不久的将来,这项技术将会在全球各地的海洋研究和保护工作中发挥越来越重要的作用,为人类与自然和谐共处开辟新的路径。

总的来说,谷歌的鲸鱼声音识别 AI 模型不仅是科技与自然结合的典范,更是未来海洋研究和保护的重要工具。通过这项创新,谷歌正在用科技的力量为海洋生物保护事业注入新的活力。