
【编者按】在人工智能浪潮席卷全球的今天,语言隔阂仍是技术普惠的一大屏障。当大多数AI模型依赖云端算力、聚焦主流语言时,一家企业悄然迈出了关键一步:让AI真正“说”出世界的声音。Cohere最新推出的Tiny Aya模型系列,不仅以开源姿态拥抱开发者,更以轻量化设计挣脱网络束缚,在笔记本电脑上即可驱动70余种语言交互。尤其值得关注的是,其对南亚、非洲等地区语言的深度优化,让技术不再只是发达地区的专属工具。这或许标志着AI民主化进入新阶段——当模型能理解孟加拉语的诗意、旁遮普语的韵律,并融入当地文化语境时,科技才真正拥有了温度。在印度AI峰会的聚光灯下,这场“静默发布”正在为下一个十亿用户铺就桥梁。
企业级人工智能公司Cohere在印度AI峰会期间,悄然推出一个全新的多语言模型家族。这款名为Tiny Aya的模型采用开放权重架构——意味着其底层代码完全公开,任何人都能自由使用与修改。它支持超过70种语言,并能直接在笔记本电脑等日常设备上运行,无需依赖网络连接。
由Cohere研究部门Cohere Labs发布的该模型,特别覆盖了南亚多国语言,包括孟加拉语、印地语、旁遮普语、乌尔都语、古吉拉特语、泰米尔语、泰卢固语和马拉地语。
基础模型包含33.5亿参数——这是衡量模型规模与复杂度的关键指标。Cohere还同步推出了TinyAya-Global版本,针对需要广泛语言支持的应用场景进行了指令跟随优化。该系列更包含三大区域定制版:TinyAya-Earth专注非洲语言;TinyAya-Fire深耕南亚语言;TinyAya-Water则覆盖亚太、西亚及欧洲语言。
公司声明中强调:“这种架构使每个模型都能构建更扎实的语言根基与文化细微差异,为服务对象打造更自然可靠的系统。与此同时,所有Tiny Aya模型仍保持广泛的多语言覆盖能力,成为适应多样化需求的灵活起点。”
值得关注的是,这些模型仅通过64块英伟达H100 GPU集群训练完成,计算资源消耗相对克制,却能为母语用户提供理想的应用开发基础。其端侧直接运行的能力,让开发者可轻松实现离线翻译功能。公司特别指出,其底层软件专为设备端部署优化,所需算力远低于同类模型。
在印度这样语言多元的国家,这种离线友好特性将开辟海量应用场景——从偏远地区的医疗问诊到网络不稳定区域的实时翻译,技术普惠的边界正在被重新定义。
目前模型已在AI开发者聚集地HuggingFace平台及Cohere官方平台开放获取。开发者可通过HuggingFace、Kaggle和Ollama进行本地化部署。公司同时公开了训练与评估数据集,并计划发布详细的技术白皮书。
这家初创公司的CEO艾丹·戈麦斯去年曾透露“即将上市”的计划。据CNBC报道,Cohere在2025年以强劲态势收官,年度经常性收入达2.4亿美元,全年保持季度环比50%的高增长态势。




