Tools/LLMs & Inference

LLMs & Inference AI Tools

Large language models and inference engines for running AI models locally or in the cloud

Featured

Run large language models locally with a simple CLI interface

Open SourceSelf-HostedOffline

Beginner

0.0 (0)

Featured

Port of Meta's LLaMA model in C/C++ for efficient CPU inference

Open SourceSelf-HostedOffline

Intermediate

0.0 (0)

Featured

High-throughput LLM serving engine with PagedAttention

Open SourceSelf-HostedOfflineGPU 16GB+

Intermediate

0.0 (0)

Featured

Unified API to call 100+ LLM providers with OpenAI format

Open SourceSelf-Hosted

Easy

0.0 (0)

Hugging Face's high-performance text generation server

Open SourceSelf-HostedOfflineGPU 16GB+

Advanced

0.0 (0)