DIMSUM AI 实验室

AI 友好的粤语语料库系统 & 服务真实环境的 AI Agent 系统

兼容岭南文化,兼容 AI 科技,
构建「粤语数据集 — 大语言模型 — AI Agent — 创新应用」为一体的完整体系。

实验室四大研究方向:
* 粤语文化精神标识体系研究
* 通用粤语语料库建设
* 大模型粤语言语交互质量评测
* 大模型粤语言语交互质量提升

ML
Model
NLP
Language
AI
Research
DL
Neural
LLM
Large
滚动探索
DIMSUM AI Logo

* 粤语爱好者 — 搜索粤语相关数据与使用粤语相关应用
* 粤语学习者 — 借助 AI,在大量高质量粤语资料和相关应用的基础上掌握粤语
* 粤语研究者 — 获取高质量粤语数据与资料,使用相关研究工具
* 语料贡献机构 — 提供粤语语料集,实现数据价值最大化
* 语料贡献个体 — 参与语料标注与语料提供的贡献,获得相应收益,共建粤语爱好者生态
* 开发者 — 参与粤语相关的基础设施和创新应用的建设,提交应用到应用商店,共建开发者生态

Dim Sum AI 实验室致力于探索一系列关键命题。

语料库开发

如何制定标注标准,高效构建大规模自主多模态粤语语料库?

应用生态系统

如何设计访问机制,基于粤语语料库创建粤语应用商店和多元化粤语应用生态系统?

搜索引擎创新

如何改进搜索算法,基于粤语语料库开发下一代AI友好的搜索引擎?

AI SaaS框架

如何创新服务模式,基于粤语语料库创建下一代AI SaaS框架?

社区建设

如何培育开源社区,围绕粤语语料库建设下一代全球建设者和研究者社区(建设者与研究者DAO)?

专为可扩展粤语AI开发设计的四层综合架构

应用层

L4

面向用户的解决方案

AI Agents
粤语应用
粤语工具
小程序
浏览器插件

API网关

L3

集成接口

REST APIs
GraphQL APIs
自然语言接口

核心服务

L2

AI基础设施

AI搜索引擎
AI SaaS框架
AI Agent 系统
插件系统

数据基础

L1

知识库

多模态数据仓库
混合标注系统