800 元实现人宠双向翻译，准确率 94.6%，PettiChat 是智商税还是真有用？

转载于 2026-05-27 09:14:08 发布 · 99 阅读

早几天间，杭州萌小译公司推出产品

杭州一家名为 "萌小译" 的公司推出一款产品，800 块就能实现我们和宠物之间的双向翻译，准确率达 94.6%。哪个铲屎官不想听懂小猫小狗的话，或者让它们听懂人类的语言，而这款产品似乎能满足这一需求。

产品功能与争议

通过兼具收音与播放功能的 AI 项圈结合手机 App，AI 项圈会把小猫小狗的声音转成文字显示在 App 内对话框，用户可在对话框发消息，项圈发出 "喵喵" 或 "汪汪" 语言让宠物 "听懂" 人类的话。不过，类似产品在微信小程序里很多，有些写着 "仅供娱乐，请勿认真"，有些用 AI 旗号分析情绪。猫猫狗狗说什么无法验证，翻译器可能用通用场景表达，将人类的话翻译成猫言狗语也因宠物认知有限难以验证，但该产品却有 94.6% 的准确率指标。

产品热度与销售情况

PettiChat 官网为 pettichat.com，萌小译推出的 AI 项圈在 X 上引发热度，网友讨论这家中国 AI 宠物翻译初创公司，也有网友质疑准确率。尽管有争议，PettiChat 在众筹平台 Kickstarter 上已募集 863 名支持者，认缴金额达 14 万港币。众筹阶段产品售价 119 美元，约合人民币 800 元，众筹结束后海外售价 149 美元。微信小店该产品以 799 元预售，有 190 人已购买，商品评论区有用户贴买家秀称 "偶尔能听听毛孩子的想法很有意思"。

翻译语言人性化

翻译的宠物语言很人性化，有大量语气助词，还有 "不客气" "别把我忘了" 等情绪感拉满的表达。人们不禁疑问，宠物真的能懂这么多信息吗？PettiChat 的准确率到底如何衡量，这类产品是不是智商税。

宠物翻译设备发展历程

2002 年，日本玩具公司 Takara 推出 BowLingual 狗狗 "情绪翻译" 项目，通过麦克风录音将狗叫归类成几种情绪状态，原理接近噱头，但卖出去了还获搞笑诺贝尔奖。二十年后，类似 AI 工具增多，年初 CES 展会 Traini 推出 AI 项圈，定位 "人对狗" 单向翻译。

PettiChat 的优势与测试数据

这次受关注的 PettiChat 拿出了测试数据。它重 27 克，夹在项圈上对宠物无额外负担，有边缘计算芯片处理音频，延迟最低 40 毫秒，无需持续联网，只在分析声音时短暂调用云端资源，还有 IP65 防水、一次充电支持 1000 次翻译和 100 小时 GPS 追踪等能力。众筹宣传提到，声学模型背后超 150 万条宠物叫声样本结合动物行为学同行评审研究，仅凭声音模式识别情绪状态准确率达 91 - 92%，加入姿态监测维度后实验室条件下综合准确率达 94.6%。

500 万 + 宠物声纹数据及测试论文

众筹页面宣传图提到两篇论文。一篇是多媒体顶会 MM 2025 的 DogSpeak 犬类发声分类数据集，作者提出大型狗叫声数据集 DogSpeak，研究能否只靠狗叫声判断狗的性别、品种和具体哪只狗，数据来自 YouTube、TikTok 等社交媒体狗视频，最终得到 156 只狗、5 个品种、77202 段狗叫序列、33.162 小时纯狗叫声，且无声音情境信息。实验显示仅靠 "纯声学特征" 难解决真实复杂环境下狗叫声识别，作者建议未来研究探索更高级特征。另一篇是 MM 2014 的城市声音研究数据集和分类法，核心贡献是 UrbanSound8K 数据集和城市声音分类法，将城市声音分类。

测试情况与准确率分析

PettiChat 引用这两篇论文数据集测试，联合浙大动科院积累 500 万 + 宠物声纹数据，约 150 万条标注，增加 UrbanSound 环境声音确保真实环境鲁棒性。使用基于阿里云通义千问大模型，参与测试的模型有未预训练的 Qwen2 - Audio、Qwen2.5 - Omni - 7B、Qwen3 - Omni - 30BA3B 以及小米 Mino - V2 - Omni。用声纹数据和 UrbanSound 8K 做独立测试集，测试模型在复杂真实环境识别宠物声音，Petti 模型平均识别/检测准确率达 98.6%，计算准确率方式是 "是否识别宠物声音"，而非 "能否翻译宠物想法"。另一项测试用 PETTI - 260315 模型测试猫/狗情境声音识别准确率，猫猫平均准确率 94.6%，狗狗 92.3%。标记声音情境利用 Video Ground Truth 概念，用视频行为、环境等对齐宠物声音和场景。本质上 94.6% 是宠物声音情境分类准确率，而非宠物语言翻译成人类语言的准确率。

从标签到拟人化翻译

模型输出原始结果可能只是标签，如狗叫识别为 "领地警戒"，App 显示 "有人来了，我要守住这里"；猫叫识别为 "急迫性请求叫声"，App 弹出 "快看看我嘛，我有点着急"。从 "行为标签" 到 "拟人化翻译" 的再加工让产品好玩、亲切，但严格说这部分不在 94.6% 覆盖范围内，测试集标准答案大概率不是自然语言，模型只需判断声音接近哪种情绪状态，无需证明宠物想说具体话语。这是所有宠物翻译产品微妙之处，它可能不是随机翻译，但也远非想象中的宠物语言翻译器。