SambaNova Cloud

Cloud PlatformOpenAI compatible

Inference cloud built on custom RDU dataflow chips, delivering high-throughput hosting of open-weight models.

Active models

Families

Founded2017

API Base URL

Type

OSS

Model	Caps	Context	Pricing
Llama 4 Maverick 17B 128E InstructOSSLlama-4-Maverick-17B-128E-Instruct	RVTSJF	131K	$0.63$1.8
gemma-4-31B-itgemma-4-31B-it		131K	$0.38$1.15
Llama 3.3 70B InstructOSSMeta-Llama-3.3-70B-Instruct	RVTSJF	131K	$0.6$1.2
Gemma 3 12B ITOSSgemma-3-12b-it	RVTSJF	131K	$0.35$0.59
DeepSeek V3.2OSSDeepSeek-V3.2	RVTSJF	33K	$3$4.5
DeepSeek V3.1OSSDeepSeek-V3.1	RVTSJF	131K	$3$4.5
DeepSeek V3.1 (continuous batching)OSSDeepSeek-V3.1-cb	RVTSJF	33K	$0.15$0.75
MiniMax M2.5OSSMiniMax-M2.5	RVTSJF	164K	$0.3$1.2
DeepSeek R1 Distill Llama 70BOSSDeepSeek-R1-Distill-Llama-70B	RVTSJF	33K	$0.7$1.4
GPT-OSS 120BOSSgpt-oss-120b	RTSJF	131K	$0.22$0.59

1–10 of 11

1 / 2