加入 Mergeek 福利群
扫码添加小助手,精彩福利不错过!
若不方便扫码,请在 Mergeek 公众号,回复 群 即可加入
- 精品限免
- 早鸟优惠
- 众测送码
Groq is Fast AI Inference
Groq的LPU™ Inference Engine是一款集硬件与软件于一体的平台,提供卓越的计算速度、质量及能效。支持快速AI推理服务,兼容LLama 3.1等开源模型,轻松实现向Groq迁移。与OpenAI端点兼容,全球GroqCloud™服务覆盖,支持公共、私有及共云实例。开发者层级提供更高速率限制及批量API折扣。Flex Tier beta支持按需处理,适用于优先推理工作负载。新用例支持在Groq速度下运行的AI应用,并引入Qwen-2.5-32b等模型,提供长上下文支持,助力复杂数学与编程任务。