Cerebras

Operational

Wafer-scale AI inference at record speeds

Ultra-fast inference powered by the world's largest AI chip.

— uptime —

API Documentation View Pricing Website

Company

Headquarters: Sunnyvale, CA
Founded: 2016

Capabilities

Models Hosted: Curated Deck Curated Deck means this provider runs a focused lineup of models, chosen for specific use cases.
Inference Speed: 2000+ tokens/sec
Specialties: Ultra-high throughput
Unique Features: Wafer-scale chips
API Style: OpenAI-compatible
Compute Location: US + Canada + EU

Models

Coming soon

We are standardizing model listings across providers.

Why Use Cerebras

Record Speed

2000+ tokens/second on wafer-scale chips.

Free Tier

Generous free tier for developers.

Details

About Cerebras

Cerebras built the world’s largest chip for unprecedented inference speed.

bots.so

The AI Inference Model Index

Models

Providers

Resources

Legal

bots.so aggregates publicly available model deployment information from official provider sources. We are not affiliated with any model provider. Model availability changes rapidly; always verify on official sites.

Cerebras

API Issues Detected

All Systems Operational

Company

Capabilities

Models

Why Use Cerebras

Record Speed

Free Tier

Details

About Cerebras

Models

Providers

Resources

Legal

Cerebras

API Issues Detected

All Systems Operational

Company

Capabilities

Models

Why Use Cerebras

Record Speed

Free Tier

Details

About Cerebras

Get the signal, skip the noise.

Models

Providers

Resources

Legal