Xây dựng, triển khai và quan sát sản phẩm AI từ một nền tảng dành cho lập trình viên.
VeloxAI hợp nhất định tuyến mô hình, agent, công cụ, kho tri thức, workflow, billing và observability sau các API tương thích OpenAI.
/v1
API có version
SSE
Sẵn sàng streaming
Qdrant
Vector cho RAG
curl https://platform.veloxforlife.cloud/v1/chat/completions \
-H "Authorization: Bearer pk_live_..." \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4o-mini",
"stream": true,
"messages": [
{ "role": "user", "content": "Summarize this ticket" }
]
}'Agent Builder
Xuất bản assistant dùng tool
Kho tri thức
Câu trả lời có nguồn từ tài liệu riêng
Workflow
Tự động hóa AI qua hàng đợi
Analytics
Token, chi phí, log và cảnh báo
15 phút
TTL của JWT access token
/v1
Public API có version
24 giờ
Thời hạn URL hình ảnh
0
API key plaintext được lưu
Mọi thứ để ship tính năng AI, không chỉ gọi một model.
VeloxAI giữ auth, API key, model routing, agent, tool, RAG, billing và observability đồng bộ qua service có scope và contract typed.
Unified Chat API
Định tuyến request qua OpenAI, Anthropic, Google, Mistral và model local bằng một contract /v1/chat/completions có SSE streaming.
Tìm hiểu thêmAgent Builder
Tạo agent nháp, xuất bản phiên bản ổn định, gắn tool và kho tri thức, rồi mở endpoint agent chat cho ứng dụng.
Tìm hiểu thêmKnowledge Base
Nạp tài liệu, URL và văn bản vào metadata PostgreSQL và vector Qdrant để semantic search và câu trả lời có trích dẫn.
Tìm hiểu thêmWorkflow Automation
Kích hoạt workflow thủ công hoặc qua webhook, chạy node AI và agent, lưu từng kết quả node và execute bằng Redis queue.
Tìm hiểu thêmImage Tools
Tạo, chỉnh sửa, upscale, xóa nền, mô tả và phát hiện nội dung hình ảnh với tracking job và output sẵn sàng lưu trữ.
Tìm hiểu thêmAnalytics + Billing
Theo dõi request, latency, token, credit, lỗi, log, rule cảnh báo và giới hạn plan từ cùng một control plane.
Tìm hiểu thêmChọn đúng model cho từng request.
Dùng một request shape cho model hosted cao cấp và backend local tương thích OpenAI. Theo dõi entitlement, token usage và chi phí ngay từ đầu.
OpenAI
Reasoning tổng quát, multimodal chat và tool calling cho production app.
Anthropic
Code quality cao, reasoning sâu, 1M context, prompt caching giảm chi phí.
Multimodal đầy đủ (video/audio/PDF), 1M context, latency thấp.
China AI
DeepSeek + Moonshot + Z.AI — reasoning mạnh, giá rẻ, context dài 200K-1M.
Mistral + Open
EU-hosted, open-weight, có thể chạy self-host qua OpenAI-compatible adapter.
Xuất bản agent có thể reasoning, truy xuất và hành động.
Agent kết hợp LLM, system prompt, tool, memory và kho tri thức. Draft an toàn, publish version và theo dõi session cùng usage và source.
Draft
Chỉnh prompt, model, memory, tool và guardrail mà không ảnh hưởng live traffic.
Publish
Snapshot cấu hình đã review thành agent_versions bất biến.
Deploy
Mở /v1/agents/:id/chat với API key có scope phù hợp.
Observe
Ghi session, message, tool call, source và token usage.
Bắt đầu miễn phí. Mở rộng bằng credit, limit và kiểm soát rõ ràng.
$0
Đủ test thật. Không cần thẻ.
- - 500 credit / tháng (~$5)
- - 2 API key
- - 3 agent
- - 20 RPM
- - Fast-tier models: gpt-4o-mini, haiku, flash, mistral-small
$29
Cho đội nhỏ đang ship sản phẩm AI đầu tiên.
- - 3.500 credit / tháng (~$35 token usage)
- - 10 API key
- - 20 agent
- - 100 RPM
- - Tất cả 14 model — bao gồm Opus 4.7, Sonnet 4.6, GPT-4o
$99
Cho đội production. Margin token tốt hơn.
- - 13.000 credit / tháng (~$130 token usage)
- - 100 API key
- - Không giới hạn agent
- - 500 RPM
- - SSO + audit log + custom model
Tùy chỉnh
Cho tổ chức cần model riêng và kiểm soát triển khai.
- - Credit tùy chỉnh
- - Rate limit tùy chỉnh
- - Hỗ trợ chuyên biệt
- - Tùy chọn on-prem
- - SLA review
Câu hỏi đội ngũ phát triển thường hỏi trước khi ship.
Câu trả lời ngắn cho kiến trúc, bảo mật, billing và quyết định workflow AI.
VeloxAI có tương thích OpenAI không?
Có. Endpoint chat lõi là /v1/chat/completions và trả về response theo kiểu OpenAI, gồm SSE chunk kết thúc bằng data: [DONE].
Vector của kho tri thức được lưu ở đâu?
Vector nằm trong Qdrant. PostgreSQL lưu metadata của knowledge base, document và chunk để search có thể mở rộng và dễ audit.
Agent có gọi tool an toàn không?
Agent có thể dùng tool built-in và custom. Custom code execution luôn bị tắt cho đến khi sandbox cứng được cấu hình.
API key có hiện lại full secret không?
Không. Full API key chỉ hiện khi tạo hoặc rotate. VeloxAI chỉ lưu hash và sau đó chỉ hiển thị prefix.
Nền tảng có giới hạn billing không?
Có. Request đi qua rate limit, credit, resource và model entitlement trước khi bắt đầu workload tốn chi phí.
Đội ngũ AI tin dùng mỗi ngày
Từ startup 2 người đến scale-up có vòng gọi vốn — đều dùng chung API key, model và agent.
2.3 tỷ
Token xử lý / tháng
99.7%
Uptime API
14
Model qua 1 endpoint
30 giây
Để tạo API key đầu tiên
Sẵn sàng đưa AI vào sản phẩm của bạn?
Tạo organization, xác thực email, sinh API key có scope và gọi VeloxAI qua contract giống production.
Tạo API key trong 30 giây.