Mistral 中文模型 7B 可微调,超过Code LLaMA2

2024-06-24 14:00:49 管理员
Mistral AI向所有人免费提供第一个大型语言模型!!!得益于像  ChatGPT 这样的杰出表现, 大语言模型最近占据了中心舞台,当  Meta 推出他们的  Llama 模型时,激发了人们对开源LLM的新兴趣,目的创建经济实惠的开源LLM,与  GPT-4 等顶级模型一样好,但没有高昂的价格标签或复杂性,这种经济性和效率的结合不仅为研究人员和开发人员开辟了新的途径,而且还为自然语言处理技术进步的新时代奠定了基础。
生成式人工智能初创公司的融资进展顺利,共同筹集了  2000 万美元,旨在塑造开源人工智能,Anthropic 还筹集了令人印象深刻的  4.5 亿美元资金,而 Cohere 与 Google Cloud 合作,在今年 6 月筹集了  2.7 亿美元资金。
Mistral 7B 简介:尺寸和可用性
Mistral AI 总部位于巴黎,由 Google DeepMind 和 Meta 的校友共同创立,宣布推出其第一个大型语言模型:Mistral 7B,任何人都可以从 GitHub 甚至通过 13.4 GB 的 torrent 轻松下载该模型。
这家初创公司甚至在产品推出之前就成功获得了创纪录的种子资金。Mistral AI 第一模式拥有  70 亿个参数模型,在所有测试中都超越了 Llama 2 13B 的性能,并在许多指标上击败了 Llama 1 34B。
与 Llama 2 等其他模型相比,Mistral 7B 提供类似或更好的功能,但 计算开销更少。虽然像 GPT-4 这样的基础模型可以实现更多目标,但它们的成本更高,而且用户界面不太友好,因为它们主要通过 API 访问。
欧洲的OpenAI
Mistral AI成立于今年5月,总部法国巴黎,3位创始人是DeepMind和Meta前员工,外界将这家公司看成是欧洲的OpenAI。
当初刚成立4周还没有产品时,就靠6个员工7页PPT拿到超过1亿美元融资,当时还引起一番争议,被当成是AI泡沫的代表,Mistral AI最初计划在2024年发布首个大模型,没想到刚到9月底就已拿出成果,团队也扩大了不少。

相关资讯

  • 本地生活服务结合AI大模型的研究

    本地生活服务结合AI大模型的研究

    本地生活服务结合AI大模型的研究,本地生活服务类似于58同城、美团点评等,是将当地、线下、具有实体店铺的餐饮、生活服务、休闲娱乐等商家服务信息,以一种“网店”的方式呈现给网民。

    管理员 0 专栏