CHI TIẾT CÔNG VIỆC:
Bạn sẽ triển khai và duy trì LLM server, xây dựng Chatbox/AI Agent, tích hợp AI với dữ liệu nội bộ và tối ưu hiệu năng mô hình trong môi trường doanh nghiệp.
NHIỆM VỤ CHÍNH:
- Triển khai và duy trì LLM server (Llama, Mistral, GPT API) trên máy chủ HPE hoặc môi trường cloud.
- Xây dựng Chatbox/AI Agent có khả năng xử lý công việc thực tế: nhắc việc, tạo báo cáo, xử lý paperwork.
- Tích hợp AI với dữ liệu nội bộ: checklist, SOP, form, CRM, email, lịch. Nghiên cứu và ứng dụng Vector Database (Milvus, Weaviate, FAISS) cho RAG pipelines.
- Sử dụng LangChain/LlamaIndex để kết nối LLM với dữ liệu có cấu trúc & phi cấu trúc. Tinh chỉnh, tối ưu hiệu năng mô hình (fine-tuning/LoRA/RAG).
- Ứng dụng Docker & GPU (CUDA) để xây dựng môi trường AI có khả năng mở rộng.
- Hợp tác với team backend/frontend để tích hợp AI vào ứng dụng web/mobile.
- Theo dõi, đánh giá và cải tiến liên tục chất lượng chatbot.
YÊU CẦU:
- Tư duy phân tích tốt, nền tảng toán học & khoa học máy tính vững chắc.
- Thành thạo Python (ưu tiên) hoặc C++/Java.
- Kinh nghiệm làm việc với LLM frameworks (LangChain, LlamaIndex, HuggingFace).
- Kiến thức tốt về Deep Learning, Machine Learning, Data Science.
- Thực hành với Vector DB (Milvus, Weaviate, FAISS).
- Am hiểu MLOps/LLMOps, cloud-based AI (AWS, Azure, GCP).
- Có khả năng đọc hiểu và ứng dụng nhanh các research papers vào bài toán thực tế.
- Thành thạo triển khai AI với Docker, GPU/CUDA.
- Tốt nghiệp Đại học trở lên chuyên ngành CNTT, Khoa học máy tính, Toán Tin hoặc các ngành liên quan.
- Có ít nhất 2 năm kinh nghiệm làm việc với dự án AI trong môi trường doanh nghiệp.
- Có tối thiểu 6 tháng kinh nghiệm thực tế với LLM/Generative AI.
- Có kinh nghiệm triển khai ứng dụng AI/LLM trong thực tế.
QUYỀN LỢI ĐƯỢC HƯỞNG:
Bạn sẽ nhận được những phúc lợi sau: thưởng tháng 13, thưởng lễ-tết, tăng lương, thưởng doanh thu và tham gia Team Building.