Yue







建设AI友好型粤语语料库,链接全球粤语AI生态

Dim Sum AI Lab


作为最具活力和辨识度的汉语方言,粤语不仅是一种交流工具,更是岭南文化的精神载体和活态文化遗产,被全球约 8500 万人+ 所使用。 在当前 AI 发展日新月异的技术背景下,构建粤语语料库及其上的人工智能应用生态,让粤语成为「AI 友好型」方言,是文化传承的挑战与机遇,也是构建粤语人工智能应用创新的基础。

在这一背景下,Dim Sum AI Lab 致力于探索一系列关键命题:

  • 如何构建标注规范,以高效建设大规模自治多模态粤语语料库(Autonomous Multimodal Cantonese Corpus)?
  • 如何设计接入机制,以在粤语语料库的基础上构建 Yue App Store 与粤语多用途应用生态?
  • 如何改进搜索算法,以在粤语语料库的基础上开发新一代人工智能友好的搜索引擎?
  • 如何创新服务模式,以在粤语语料库的基础上打造新一代 AI SaaS 框架?
  • 如何培育开源社区,以围绕粤语语料库创建新一代全球化的建设者与研究者社区(DAO for Buidlers & Researchers)?
+--------------- Yue 应用商店 powered by AI ------------------+
   🤖 Yue AI Agents    |   📱 Yue Apps   |    🛠️  Yue Tools 
+------------------------------------------------------------+
        ↑                       ↑                       ↑
+------------------------------------------------------------+
|                            APIs                            |
+------------------------------------------------------------+
        ↑                       ↑                       ↑
+------------------------+ +----------------+ +--------------+ +--------+
| 🚗 人工智能友好的搜索引擎 | | 🤖 AI SaaS 框架 | |  🔌 扩展插件    | |  LLMs  |
+------------------------+ +----------------+ +--------------+ +--------+
                                   ↑               ↑     接入       |
                                   +---------------+---------------+
        ↑                       ↑                       ↑
+-----------------------------+ +----------------------------+
|  多模态数据库(文本/音频/视频)  | |  🔖 标注系统(AI+人工+区块链) |
+-----------------------------+ +----------------------------+

© 2025 Key Lab of Cantonese Corpus Construction and AI Agents. All rights reserved. DimSum AI Lab 版权所有 | 苏ICP备2025170597号