
阿布扎比人工智能和云计算公司G42旗下的Core42发布了一款在阿联酋开发的阿拉伯语和英语双语聊天机器人Jais Chat。
该应用程序可以在iPhone设备上免费下载,精通阿拉伯语和英语。根据Core42的说法,该应用程序采用了以阿拉伯语为中心的模型,用于有效处理阿拉伯语文本。
使用过OpenAI的ChatGPT或微软的CoPilot的人对Jais Chat的界面很熟悉。
用户可以使用各种提示来获取答案、收集信息,并找到传统搜索引擎无法找到的解决方案。
Jais Chat基于G42的阿拉伯语大型语言模型Jais,该模型于去年与穆罕默德·本·扎耶德人工智能大学和硅谷的Cerebras Systems合作发布。
Core42执行副总裁兼首席人工智能官安德鲁·杰克逊(Andrew Jackson)表示:“通过阿拉伯语优先的方法,Jais重塑了双语个人与技术的互动方式,通过Jais Chat的移动应用,我们正在实现我们的使命,即让世界人工智能访问民主化。”
在更具体的层面上,Jais Chat使用“Jais 30B”,根据开发人员的说法,它是在一个由总共1.63万亿个令牌组成的数据集上训练的,其中4750亿个是阿拉伯语令牌,其余包括英语和代码令牌。
在AI世界中,标记是用于计算文本的基本单位,较高的标记计数会产生更好、更全面的结果。
Core42表示:“因此,Jais Chat在阿拉伯语语言处理和准确性方面提供了无与伦比的结果,同时提供了毫不妥协的英语语言处理,可与同等规模的顶级英语语言模型相媲美。”
Core42表示,Jais Chat的未来迭代将支持文档处理、语音对话功能,以及为寻求定制功能的企业提供订阅模式的企业支持。
这款应用的名字“Jais”指的是阿联酋的最高峰哈伊马角。
虽然阿拉伯语是世界上使用最广泛的语言之一,大约有4亿人使用,但在人工智能发展和大型语言模型的最初发展阶段,它并不是人工智能产品的前沿,英语被证明是最普遍的。
阿拉伯语方言的复杂性和多样性,加上各种语言的细微差别,也给试图完善机器学习技术的工程师和程序员带来了挑战。
去年,随着各种阿拉伯法学硕士(包括耆那教法学硕士)的引入,以及其他将阿拉伯语纳入其中的进步和努力,这种情况发生了变化。
“自Jais于2023年8月成立以来,反响一直非常积极,”杰克逊表示。他说:“随着最近Jais 30B的发射,我们看到其性能指标与前一代相比有了显着提高。”
Core42将Jais 30B描述为“世界上性能最高的阿拉伯语大型语言模型”。
点击分享到









