A platform for fast inference of generative AI models, including fine-tuning and deployment.
Fireworks AI 是一个旨在提供生成式 AI 模型快速推理的平台。它允许用户以高速度使用最先进的开源大语言模型 (LLM) 和图像模型。用户可以在无需额外费用的情况下微调和部署自己的模型。该平台提供了一系列构建和部署生成式 AI 应用的工具和基础设施,包括模型 API、定制选项和复合 AI 系统。
用户可以通过 API 运行热门模型,自定义模型以提高性能,并使用 FireFunction 构建复合 AI 系统,执行检索增强生成 (RAG)、搜索及领域专家助手等任务。
快速推理支持100+种模型
几分钟内即可微调和部署
复合 AI 系统的构建模块
生产级基础设施