Model/Groq/models.json

{
    "chat": {
        "llama3-8b-8192": {
            "description": "LLaMA3 8b",
            "inputTokens": 8192,
            "inputTokenPrice": 0.05,
            "outputTokens": 8192,
            "outputTokenPrice": 0.08
        },
        "llama3-70b-8192": {
            "description": "LLaMA3 70b",
            "inputTokens": 8192,
            "inputTokenPrice": 0.59,
            "outputTokens": 8192,
            "outputTokenPrice": 0.79
        },
        "llama2-70b-4096": {
            "description": "LLaMA2 70b",
            "inputTokens": 4096,
            "inputTokenPrice": 0.7,
            "outputTokens": 4096,
            "outputTokenPrice": 0.8
        },
        "mixtral-8x7b-32768": {
            "description": "Mixtral 8x7b",
            "inputTokens": 32768,
            "inputTokenPrice": 0.24,
            "outputTokens": 32768,
            "outputTokenPrice": 0.24
        },
        "llama-3.1-8b-instant": {
            "description": "",
            "inputTokens": 128000,
            "inputTokenPrice": 0.05,
            "outputTokens": 8192,
            "outputTokenPrice": 0.08
        },
        "llama-3.1-405b-reasoning": {
            "description": "",
            "inputTokens": 8192,
            "inputTokenPrice": 0.59,
            "outputTokens": 8192,
            "outputTokenPrice": 0.79
        },
        "gemma2-9b-it": {
            "description": "Gemma is a family of lightweight, state-of-the-art open models from Google, built from the same research and technology used to create the Gemini models. They are text-to-text, decoder-only large language models, available in English, with open weights, pre-trained variants, and instruction-tuned variants. Gemma models are well-suited for a variety of text generation tasks, including question answering, summarization, and reasoning. Their relatively small size makes it possible to deploy them in environments with limited resources such as a laptop, desktop or your own cloud infrastructure, democratizing access to state of the art AI models and helping foster innovation for everyone.",
            "inputTokens": 8192,
            "inputTokenPrice": 0.2,
            "outputTokens": 8192,
            "outputTokenPrice": 0.2
        },
        "deepseek-r1-distill-llama-70b": {
            "description": "",
            "inputTokens": 131072,
            "inputTokenPrice": 0.75,
            "outputTokens": 131072,
            "outputTokenPrice": 0.99
        },
        "llama-3.3-70b-versatile": {
            "description": "",
            "inputTokens": 128000,
            "inputTokenPrice": 0.59,
            "outputTokens": 32768,
            "outputTokenPrice": 0.79
        },
        "llama-3.3-70b-specdec": {
            "description": "",
            "inputTokens": 8192,
            "inputTokenPrice": 0.59,
            "outputTokens": 8192,
            "outputTokenPrice": 0.99
        },
        "llama-3.1-70b-versatile": {
            "description": "",
            "inputTokens": 8192,
            "inputTokenPrice": 0.59,
            "outputTokens": 8192,
            "outputTokenPrice": 0.79
        },
        "gemma-7b-it": {
            "description": "",
            "inputTokens": 8192,
            "inputTokenPrice": 0.05,
            "outputTokens": 8192,
            "outputTokenPrice": 0.08
        },
        "llama-guard-4-12b": {
            "description": "",
            "inputTokens": 8192,
            "inputTokenPrice": 0.2,
            "outputTokens": 8192,
            "outputTokenPrice": 0.2
        },
        "llama-4-maverick-17b-128e-instruct": {
            "description": "",
            "inputTokens": 131072,
            "inputTokenPrice": 0.2,
            "outputTokens": 8192,
            "outputTokenPrice": 0.6
        },
        "llama-4-scout-17b-16e-instruct": {
            "description": "",
            "inputTokens": 131072,
            "inputTokenPrice": 0.11,
            "outputTokens": 8192,
            "outputTokenPrice": 0.34
        },
        "kimi-k2-instruct-0905": {
            "description": "",
            "inputTokens": 262144,
            "inputTokenPrice": 1,
            "outputTokens": 16384,
            "outputTokenPrice": 3
        },
        "gpt-oss-120b": {
            "description": "",
            "inputTokens": 131072,
            "inputTokenPrice": 0.15,
            "outputTokens": 32766,
            "outputTokenPrice": 0.6
        },
        "gpt-oss-20b": {
            "description": "",
            "inputTokens": 131072,
            "inputTokenPrice": 0.08,
            "outputTokens": 32768,
            "outputTokenPrice": 0.3
        },
        "gpt-oss-safeguard-20b": {
            "description": "",
            "inputTokens": 131072,
            "inputTokenPrice": 0.08,
            "outputTokens": 65536,
            "outputTokenPrice": 0.3
        },
        "qwen3-32b": {
            "description": "",
            "inputTokens": 131000,
            "inputTokenPrice": 0.29,
            "outputTokens": 131000,
            "outputTokenPrice": 0.59
        }
    }
}