VeloxAI
Nền tảng AI đa mô hình

Xây dựng, triển khai và quan sát sản phẩm AI từ một nền tảng dành cho lập trình viên.

VeloxAI hợp nhất định tuyến mô hình, agent, công cụ, kho tri thức, workflow, billing và observability sau các API tương thích OpenAI.

/v1

API có version

SSE

Sẵn sàng streaming

Qdrant

Vector cho RAG

VeloxAI · /v1
curl https://platform.veloxforlife.cloud/v1/chat/completions \
  -H "Authorization: Bearer pk_live_..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o-mini",
    "stream": true,
    "messages": [
      { "role": "user", "content": "Summarize this ticket" }
    ]
  }'

Agent Builder

Xuất bản assistant dùng tool

Kho tri thức

Câu trả lời có nguồn từ tài liệu riêng

Workflow

Tự động hóa AI qua hàng đợi

Analytics

Token, chi phí, log và cảnh báo

One API. Fourteen models.
GPT-4oOpenAI
GPT-4o miniOpenAI
o3 miniOpenAI
Claude Opus 4.7Anthropic
Claude Sonnet 4.6Anthropic
Claude Haiku 4.5Anthropic
Gemini 2.5 ProGoogle
Gemini 2.5 FlashGoogle
Mistral Large 2Mistral
Mistral Small 3Mistral
DeepSeek V4 ProDeepSeek
DeepSeek V4 FlashDeepSeek
Kimi K2.6Moonshot
GLM-4.6Z.AI
Llama 3.1 70BOpen
Qwen 2.5 72BOpen
GPT-4oOpenAI
GPT-4o miniOpenAI
o3 miniOpenAI
Claude Opus 4.7Anthropic
Claude Sonnet 4.6Anthropic
Claude Haiku 4.5Anthropic
Gemini 2.5 ProGoogle
Gemini 2.5 FlashGoogle
Mistral Large 2Mistral
Mistral Small 3Mistral
DeepSeek V4 ProDeepSeek
DeepSeek V4 FlashDeepSeek
Kimi K2.6Moonshot
GLM-4.6Z.AI
Llama 3.1 70BOpen
Qwen 2.5 72BOpen

15 phút

TTL của JWT access token

/v1

Public API có version

24 giờ

Thời hạn URL hình ảnh

0

API key plaintext được lưu

Nền tảng

Mọi thứ để ship tính năng AI, không chỉ gọi một model.

VeloxAI giữ auth, API key, model routing, agent, tool, RAG, billing và observability đồng bộ qua service có scope và contract typed.

Xem nền tảng
Tương thích OpenAI

Unified Chat API

Định tuyến request qua OpenAI, Anthropic, Google, Mistral và model local bằng một contract /v1/chat/completions có SSE streaming.

Tìm hiểu thêm
Tool + memory

Agent Builder

Tạo agent nháp, xuất bản phiên bản ổn định, gắn tool và kho tri thức, rồi mở endpoint agent chat cho ứng dụng.

Tìm hiểu thêm
RAG riêng tư

Knowledge Base

Nạp tài liệu, URL và văn bản vào metadata PostgreSQL và vector Qdrant để semantic search và câu trả lời có trích dẫn.

Tìm hiểu thêm
Run AI-native

Workflow Automation

Kích hoạt workflow thủ công hoặc qua webhook, chạy node AI và agent, lưu từng kết quả node và execute bằng Redis queue.

Tìm hiểu thêm
Job bất đồng bộ

Image Tools

Tạo, chỉnh sửa, upscale, xóa nền, mô tả và phát hiện nội dung hình ảnh với tracking job và output sẵn sàng lưu trữ.

Tìm hiểu thêm
Quota-aware

Analytics + Billing

Theo dõi request, latency, token, credit, lỗi, log, rule cảnh báo và giới hạn plan từ cùng một control plane.

Tìm hiểu thêm
Định tuyến model

Chọn đúng model cho từng request.

Dùng một request shape cho model hosted cao cấp và backend local tương thích OpenAI. Theo dõi entitlement, token usage và chi phí ngay từ đầu.

OpenAI

OpenAI

Reasoning tổng quát, multimodal chat và tool calling cho production app.

gpt-4ogpt-4o-minio3-mini
Anthropic

Anthropic

Code quality cao, reasoning sâu, 1M context, prompt caching giảm chi phí.

claude-opus-4-7claude-sonnet-4-6claude-haiku-4-5
Google

Google

Multimodal đầy đủ (video/audio/PDF), 1M context, latency thấp.

gemini-2.5-progemini-2.5-flash
China AI

China AI

DeepSeek + Moonshot + Z.AI — reasoning mạnh, giá rẻ, context dài 200K-1M.

deepseek-v4-prodeepseek-v4-flashkimi-k2.6glm-4.6
Mistral + Open

Mistral + Open

EU-hosted, open-weight, có thể chạy self-host qua OpenAI-compatible adapter.

mistral-large-2mistral-small-3llama-3.1-70bqwen-2.5-72b
Agent Builder

Xuất bản agent có thể reasoning, truy xuất và hành động.

Agent kết hợp LLM, system prompt, tool, memory và kho tri thức. Draft an toàn, publish version và theo dõi session cùng usage và source.

Draft

Chỉnh prompt, model, memory, tool và guardrail mà không ảnh hưởng live traffic.

Publish

Snapshot cấu hình đã review thành agent_versions bất biến.

Deploy

Mở /v1/agents/:id/chat với API key có scope phù hợp.

Observe

Ghi session, message, tool call, source và token usage.

Bảng giá

Bắt đầu miễn phí. Mở rộng bằng credit, limit và kiểm soát rõ ràng.

Free

$0

Đủ test thật. Không cần thẻ.

  • - 500 credit / tháng (~$5)
  • - 2 API key
  • - 3 agent
  • - 20 RPM
  • - Fast-tier models: gpt-4o-mini, haiku, flash, mistral-small
Starter

$29

Cho đội nhỏ đang ship sản phẩm AI đầu tiên.

  • - 3.500 credit / tháng (~$35 token usage)
  • - 10 API key
  • - 20 agent
  • - 100 RPM
  • - Tất cả 14 model — bao gồm Opus 4.7, Sonnet 4.6, GPT-4o
Phổ biến nhất

$99

Cho đội production. Margin token tốt hơn.

  • - 13.000 credit / tháng (~$130 token usage)
  • - 100 API key
  • - Không giới hạn agent
  • - 500 RPM
  • - SSO + audit log + custom model
Enterprise

Tùy chỉnh

Cho tổ chức cần model riêng và kiểm soát triển khai.

  • - Credit tùy chỉnh
  • - Rate limit tùy chỉnh
  • - Hỗ trợ chuyên biệt
  • - Tùy chọn on-prem
  • - SLA review
Q&A

Câu hỏi đội ngũ phát triển thường hỏi trước khi ship.

Câu trả lời ngắn cho kiến trúc, bảo mật, billing và quyết định workflow AI.

VeloxAI có tương thích OpenAI không?

Có. Endpoint chat lõi là /v1/chat/completions và trả về response theo kiểu OpenAI, gồm SSE chunk kết thúc bằng data: [DONE].

Vector của kho tri thức được lưu ở đâu?

Vector nằm trong Qdrant. PostgreSQL lưu metadata của knowledge base, document và chunk để search có thể mở rộng và dễ audit.

Agent có gọi tool an toàn không?

Agent có thể dùng tool built-in và custom. Custom code execution luôn bị tắt cho đến khi sandbox cứng được cấu hình.

API key có hiện lại full secret không?

Không. Full API key chỉ hiện khi tạo hoặc rotate. VeloxAI chỉ lưu hash và sau đó chỉ hiển thị prefix.

Nền tảng có giới hạn billing không?

Có. Request đi qua rate limit, credit, resource và model entitlement trước khi bắt đầu workload tốn chi phí.

10.000+ developer

Đội ngũ AI tin dùng mỗi ngày

Từ startup 2 người đến scale-up có vòng gọi vốn — đều dùng chung API key, model và agent.

2.3 tỷ

Token xử lý / tháng

99.7%

Uptime API

14

Model qua 1 endpoint

30 giây

Để tạo API key đầu tiên

OpenAIOpenAI
AnthropicAnthropic
GoogleGoogle
DeepSeekDeepSeek
MistralMistral
MetaMeta
Free — không cần thẻ

Sẵn sàng đưa AI vào sản phẩm của bạn?

Tạo organization, xác thực email, sinh API key có scope và gọi VeloxAI qua contract giống production.

Bắt đầu xây dựng

Tạo API key trong 30 giây.