商业
阿联酋开发的阿拉伯语聊天机器人Jais Chat亮相

  

  阿布扎比人工智能和云计算公司G42旗下的Core42发布了一款在阿联酋开发的阿拉伯语和英语双语聊天机器人Jais Chat。

  该应用程序可以在iPhone设备上免费下载,精通阿拉伯语和英语。根据Core42的说法,该应用程序采用了以阿拉伯语为中心的模型,用于有效处理阿拉伯语文本。

  使用过OpenAI的ChatGPT或微软的CoPilot的人对Jais Chat的界面很熟悉。

  用户可以使用各种提示来获取答案、收集信息,并找到传统搜索引擎无法找到的解决方案。

  Jais Chat基于G42的阿拉伯语大型语言模型Jais,该模型于去年与穆罕默德·本·扎耶德人工智能大学和硅谷的Cerebras Systems合作发布。

  Core42执行副总裁兼首席人工智能官安德鲁·杰克逊(Andrew Jackson)表示:“通过阿拉伯语优先的方法,Jais重塑了双语个人与技术的互动方式,通过Jais Chat的移动应用,我们正在实现我们的使命,即让世界人工智能访问民主化。”

  在更具体的层面上,Jais Chat使用“Jais 30B”,根据开发人员的说法,它是在一个由总共1.63万亿个令牌组成的数据集上训练的,其中4750亿个是阿拉伯语令牌,其余包括英语和代码令牌。

  在AI世界中,标记是用于计算文本的基本单位,较高的标记计数会产生更好、更全面的结果。

  Core42表示:“因此,Jais Chat在阿拉伯语语言处理和准确性方面提供了无与伦比的结果,同时提供了毫不妥协的英语语言处理,可与同等规模的顶级英语语言模型相媲美。”

  Core42表示,Jais Chat的未来迭代将支持文档处理、语音对话功能,以及为寻求定制功能的企业提供订阅模式的企业支持。

  这款应用的名字“Jais”指的是阿联酋的最高峰哈伊马角。

  虽然阿拉伯语是世界上使用最广泛的语言之一,大约有4亿人使用,但在人工智能发展和大型语言模型的最初发展阶段,它并不是人工智能产品的前沿,英语被证明是最普遍的。

  阿拉伯语方言的复杂性和多样性,加上各种语言的细微差别,也给试图完善机器学习技术的工程师和程序员带来了挑战。

  去年,随着各种阿拉伯法学硕士(包括耆那教法学硕士)的引入,以及其他将阿拉伯语纳入其中的进步和努力,这种情况发生了变化。

  “自Jais于2023年8月成立以来,反响一直非常积极,”杰克逊表示。他说:“随着最近Jais 30B的发射,我们看到其性能指标与前一代相比有了显着提高。”

  Core42将Jais 30B描述为“世界上性能最高的阿拉伯语大型语言模型”。

点击分享到

热门推荐