Nền tảng AI đa mô hình

Xây dựng, triển khai và quan sát sản phẩm AI từ một nền tảng dành cho lập trình viên.

VeloxAI hợp nhất định tuyến mô hình, agent, công cụ, kho tri thức, workflow, billing và observability sau các API tương thích OpenAI.

Bắt đầu xây dựng Khám phá nền tảng

/v1

API có version

SSE

Sẵn sàng streaming

Qdrant

Vector cho RAG

VeloxAI · /v1

curl https://platform.veloxforlife.cloud/v1/chat/completions \
  -H "Authorization: Bearer pk_live_..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o-mini",
    "stream": true,
    "messages": [
      { "role": "user", "content": "Summarize this ticket" }
    ]
  }'

Agent Builder

Xuất bản assistant dùng tool

Kho tri thức

Câu trả lời có nguồn từ tài liệu riêng

Workflow

Tự động hóa AI qua hàng đợi

Analytics

Token, chi phí, log và cảnh báo

One API. Fourteen models.

GPT-4oOpenAI

GPT-4o miniOpenAI

o3 miniOpenAI

Claude Opus 4.7Anthropic

Claude Sonnet 4.6Anthropic

Claude Haiku 4.5Anthropic

Gemini 2.5 ProGoogle

Gemini 2.5 FlashGoogle

Mistral Large 2Mistral

Mistral Small 3Mistral

DeepSeek V4 ProDeepSeek

DeepSeek V4 FlashDeepSeek

Kimi K2.6Moonshot

GLM-4.6Z.AI

Llama 3.1 70BOpen

Qwen 2.5 72BOpen

GPT-4oOpenAI

GPT-4o miniOpenAI

o3 miniOpenAI

Claude Opus 4.7Anthropic

Claude Sonnet 4.6Anthropic

Claude Haiku 4.5Anthropic

Gemini 2.5 ProGoogle

Gemini 2.5 FlashGoogle

Mistral Large 2Mistral

Mistral Small 3Mistral

DeepSeek V4 ProDeepSeek

DeepSeek V4 FlashDeepSeek

Kimi K2.6Moonshot

GLM-4.6Z.AI

Llama 3.1 70BOpen

Qwen 2.5 72BOpen

15 phút

TTL của JWT access token

/v1

Public API có version

24 giờ

Thời hạn URL hình ảnh

API key plaintext được lưu

Nền tảng

Mọi thứ để ship tính năng AI, không chỉ gọi một model.

VeloxAI giữ auth, API key, model routing, agent, tool, RAG, billing và observability đồng bộ qua service có scope và contract typed.

Xem nền tảng

Tương thích OpenAI

Unified Chat API

Định tuyến request qua OpenAI, Anthropic, Google, Mistral và model local bằng một contract /v1/chat/completions có SSE streaming.

Tìm hiểu thêm

Tool + memory

Agent Builder

Tạo agent nháp, xuất bản phiên bản ổn định, gắn tool và kho tri thức, rồi mở endpoint agent chat cho ứng dụng.

Tìm hiểu thêm

RAG riêng tư

Knowledge Base

Nạp tài liệu, URL và văn bản vào metadata PostgreSQL và vector Qdrant để semantic search và câu trả lời có trích dẫn.

Tìm hiểu thêm

Run AI-native

Workflow Automation

Kích hoạt workflow thủ công hoặc qua webhook, chạy node AI và agent, lưu từng kết quả node và execute bằng Redis queue.

Tìm hiểu thêm

Job bất đồng bộ

Image Tools

Tạo, chỉnh sửa, upscale, xóa nền, mô tả và phát hiện nội dung hình ảnh với tracking job và output sẵn sàng lưu trữ.

Tìm hiểu thêm

Quota-aware

Analytics + Billing

Theo dõi request, latency, token, credit, lỗi, log, rule cảnh báo và giới hạn plan từ cùng một control plane.

Tìm hiểu thêm

Định tuyến model

Chọn đúng model cho từng request.

Dùng một request shape cho model hosted cao cấp và backend local tương thích OpenAI. Theo dõi entitlement, token usage và chi phí ngay từ đầu.

Khám phá model Mở playground

OpenAI

Reasoning tổng quát, multimodal chat và tool calling cho production app.

gpt-4ogpt-4o-minio3-mini

Anthropic

Code quality cao, reasoning sâu, 1M context, prompt caching giảm chi phí.

claude-opus-4-7claude-sonnet-4-6claude-haiku-4-5

Google

Multimodal đầy đủ (video/audio/PDF), 1M context, latency thấp.

gemini-2.5-progemini-2.5-flash

China AI

DeepSeek + Moonshot + Z.AI — reasoning mạnh, giá rẻ, context dài 200K-1M.

deepseek-v4-prodeepseek-v4-flashkimi-k2.6glm-4.6

Mistral + Open

EU-hosted, open-weight, có thể chạy self-host qua OpenAI-compatible adapter.

mistral-large-2mistral-small-3llama-3.1-70bqwen-2.5-72b

Agent Builder

Xuất bản agent có thể reasoning, truy xuất và hành động.

Agent kết hợp LLM, system prompt, tool, memory và kho tri thức. Draft an toàn, publish version và theo dõi session cùng usage và source.

Xem agent Tạo agent

Draft

Chỉnh prompt, model, memory, tool và guardrail mà không ảnh hưởng live traffic.

Publish

Snapshot cấu hình đã review thành agent_versions bất biến.

Deploy

Mở /v1/agents/:id/chat với API key có scope phù hợp.

Observe

Ghi session, message, tool call, source và token usage.

Bảng giá

Bắt đầu miễn phí. Mở rộng bằng credit, limit và kiểm soát rõ ràng.

Free

$0

Đủ test thật. Không cần thẻ.

- 500 credit / tháng (~$5)
- 2 API key
- 3 agent
- 20 RPM
- Fast-tier models: gpt-4o-mini, haiku, flash, mistral-small

Starter

$29

Cho đội nhỏ đang ship sản phẩm AI đầu tiên.

- 3.500 credit / tháng (~$35 token usage)
- 10 API key
- 20 agent
- 100 RPM
- Tất cả 14 model — bao gồm Opus 4.7, Sonnet 4.6, GPT-4o

Phổ biến nhất

$99

Cho đội production. Margin token tốt hơn.

- 13.000 credit / tháng (~$130 token usage)
- 100 API key
- Không giới hạn agent
- 500 RPM
- SSO + audit log + custom model

Enterprise

Tùy chỉnh

Cho tổ chức cần model riêng và kiểm soát triển khai.

- Credit tùy chỉnh
- Rate limit tùy chỉnh
- Hỗ trợ chuyên biệt
- Tùy chọn on-prem
- SLA review

So sánh gói Bắt đầu miễn phí

Q&A

Câu hỏi đội ngũ phát triển thường hỏi trước khi ship.

Câu trả lời ngắn cho kiến trúc, bảo mật, billing và quyết định workflow AI.

VeloxAI có tương thích OpenAI không?

Có. Endpoint chat lõi là /v1/chat/completions và trả về response theo kiểu OpenAI, gồm SSE chunk kết thúc bằng data: [DONE].

Vector của kho tri thức được lưu ở đâu?

Vector nằm trong Qdrant. PostgreSQL lưu metadata của knowledge base, document và chunk để search có thể mở rộng và dễ audit.

Agent có gọi tool an toàn không?

Agent có thể dùng tool built-in và custom. Custom code execution luôn bị tắt cho đến khi sandbox cứng được cấu hình.

API key có hiện lại full secret không?

Không. Full API key chỉ hiện khi tạo hoặc rotate. VeloxAI chỉ lưu hash và sau đó chỉ hiển thị prefix.

Nền tảng có giới hạn billing không?

Có. Request đi qua rate limit, credit, resource và model entitlement trước khi bắt đầu workload tốn chi phí.

10.000+ developer

Đội ngũ AI tin dùng mỗi ngày

Từ startup 2 người đến scale-up có vòng gọi vốn — đều dùng chung API key, model và agent.

2.3 tỷ

Token xử lý / tháng

99.7%

Uptime API

Model qua 1 endpoint

30 giây

Để tạo API key đầu tiên

OpenAI

Anthropic

Google

DeepSeek

Mistral

Sẵn sàng đưa AI vào sản phẩm của bạn?

Tạo organization, xác thực email, sinh API key có scope và gọi VeloxAI qua contract giống production.

Bắt đầu xây dựng

Tạo API key trong 30 giây.