Cách viết eval cho sản phẩm AI trước khi ship
Ship tính năng AI mà chưa có eval là đang đoán mò. Đây là một framework nhẹ — golden input, rubric rõ ràng, một lần chấm điểm — có thể xây trong một buổi chiều.
Hành trình thật khi xây dựng một sản phẩm AI — những đánh cược, những lần viết lại, và thứ thực sự ra mắt.
Tất cả bài viết
Ship tính năng AI mà chưa có eval là đang đoán mò. Đây là một framework nhẹ — golden input, rubric rõ ràng, một lần chấm điểm — có thể xây trong một buổi chiều.

Vibe coding cho phép bạn làm phần mềm chỉ bằng cách mô tả thứ mình muốn bằng lời. Đây là nó là gì, mạnh ở đâu, gãy ở đâu, và làm sao để làm cho ra hồn.

Một người dùng báo rằng những session dài làm Codepet giật và ngốn bộ nhớ. Chúng tôi biết chính xác phải sửa gì, và phép đo chứng minh chúng tôi sai hoàn toàn. Một câu chuyện kỹ thuật ngắn về việc cưỡng lại điều hiển nhiên.

Chuyện thật về một năm làm app macOS chạy bằng AI: những ván cược được giá, những tính năng buộc phải buông, và đôi điều cho bất kỳ ai đang làm sản phẩm AI lúc này.