去年,谷歌在 Android 的“实时字幕”(Live Caption)系统中引入了“情感字幕”(Expressive Captions)功能。情感字幕不仅显示音频中说了什么,还展示了说话的方式,捕捉诸如语气、音量、环境声音和人类发出的各种声音等元素。其目的是让即使听不到音频的用户,也能感受到其情绪和氛围。现在,谷歌似乎正在扩大支持情感字幕的 Android 设备范围,只要设备支持实时字幕功能,就有可能获得这一增强体验。

在深入研究最新版本的 Android 系统智能(Android System Intelligence)(版本号:V.23.playstore.pixel9.741245583)时,我们发现谷歌可能正在为实时字幕(Live Caption)系统添加新的情感字幕(Expressive Captions)选项。
当前的情感字幕列表包含以下内容:
- 鼓掌(Applause)
- 欢呼(Cheering)
- 拍手(Clapping)
- 咳嗽(Coughs)
- 哭泣(Crying)
- 倒吸气(Gasps)
- 呻吟(Groaning)
- 笑声(Laughter)
- 音乐(Music)
- 喘息(Panting)
- 叹气(Sighs)
- 哼鼻声(Snorts)
我们现在发现,这个列表正在扩展,新增加的情感字幕包括:
- 低语(Whispering)
- 吹口哨(Whistles)
- 铃声(环境声音)(Bells ringing)
- 打嗝(Burps)
- 漱口声(Gargles)
- 嗝(Hiccups)
- 打喷嚏(Sneeze)
- 打鼾(Snore)
- 清嗓子(Clear throat)
- 哈欠(Yawns)
因此,如果你在运行 Android 14 或更高版本的设备上启用了实时字幕功能,当音频中包含这些声音时,你很快就会看到新增的情感字幕。
不过需要注意的是,这一版本的 Android System Intelligence 似乎是通过 Google Play 商店的特定更新面向 Pixel 9 设备的,这意味着增强版的情感字幕功能可能会率先在 Pixel 9 手机上推出,然后再逐步扩展到其他 Pixel 和 Android 设备上。