All model metrics
Search and compare exploratory models on Together.ai.
How to read scores
Each number is a 0–100 checklist composite from our lab battery — not a real-world accuracy percentage or a user preference ranking.
- 85+ Strong on the tested checklist
- 65–84 Solid, with room to improve
- <65 Early or mixed results — common on strict v1 gates
Compile means the model passed engine routing gates for deployment — not a product endorsement. Full methodology
Exploratory models on Together.ai — capability-tested for comparison; safety testing is not required for this cohort.
Wide table — scroll sideways on desktop, or view as cards on mobile.
| Identity | Capability | Safety | Performance | Status | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Model | Vendor | Deploy | Accuracy | Reasoning | Coding | Slop | Reliability | Cap. safety | Jailbreak | PII | Bias | Latency | Cost | Stability | Badges | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Llama 3.3 70B Instruct Turbo Exploratory · safety not required | Meta | 54.4% | 61.3% | 25% | 60% | 0% | 80% | 83.3% | — | Not tested | Not tested | 63.8% | 50% | 100% | Below compile bar Not tested | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Model key: meta-llama/Llama-3.3-70B-Instruct-Turbo
Model ID: meta-llama/Llama-3.3-70B-Instruct-Turbo
Size band: 9to70b
Provenance: provider_standard
Capability pack: bench-pack-v2
Safety pack: —
Latency P95: 10858 ms
Throughput P50: 20.7 tps
Cost / task: $0.000126
Strengths
Standards
Slop profiles
Compile gates
Safety gatesNot tested Weakness tags
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Llama 3.3 70B Instruct Turbo (Together) Exploratory · safety not required | Meta | 55.4% | 61.3% | 25% | 60% | 0% | 80% | 83.3% | — | Not tested | Not tested | 68.8% | 50% | 100% | Below compile bar Not tested | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Model key: together/meta-llama/llama-3.3-70b-instruct-turbo@created-1733507177
Model ID: meta-llama/llama-3.3-70b-instruct-turbo
Size band: 9to70b
Provenance: provider_standard
Capability pack: bench-pack-v2
Safety pack: —
Latency P95: 9363 ms
Throughput P50: 13.5 tps
Cost / task: $0.000127
Strengths
Standards
Slop profiles
Compile gates
Safety gatesNot tested Weakness tags
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||