Bài 4 - Input Format: Tại sao AI đọc sai 3 dòng trên Bảng cân đối
Bạn đã từng làm điều này chưa: Tải BCTC quý của một công ty niêm yết về, quăng lên ChatGPT hoặc Gemini, gõ “phân tích tình hình tài chính giúp tôi” - rồi nhận về kết quả trông có vẻ ổn. Số liệu đầy đủ, nhận xét rành mạch. Bạn dùng luôn.
Cho đến khi đối chiếu lại với file gốc, mới phát hiện hàng loạt thứ sai. Doanh thu bị đọc nhầm dòng. Chỉ số nợ tính từ con số không đúng. Một vài chỗ AI tự bịa số mà trong báo cáo không hề có.
Không phải AI dốt. Không phải bạn dùng sai. Đây là thứ mà hầu hết các bài hướng dẫn dùng AI trên internet không ai thèm giải thích.
Vấn đề nằm ở đâu?
Hãy hình dung thế này: Máy tính bình thường giống như nhân viên văn phòng quen việc - đưa file Excel thì mở Excel, đưa PDF thì mở PDF, không cần giải thích gì thêm.
AI thì khác hoàn toàn. AI giống như một người chỉ biết đọc chữ viết tay. Bạn đưa cho nó bất kỳ tài liệu nào - Excel, PDF, Word - nó đều phải “dịch” tài liệu đó sang dạng chữ thuần trước khi đọc được. Bước dịch đó đôi khi sạch, đôi khi bị lỗi, đôi khi mất hẳn một đống thông tin - tùy vào loại file bạn đưa vào.
Đó là lý do cùng một nội dung, file này AI hiểu đúng, file kia AI đọc sai hoặc tự bịa số.
Loại file nào AI đọc tốt, loại nào dễ gây lỗi?
🟢 Nhóm 1 - Đưa vào là yên tâm
Các file .txt, .csv và .md là nhóm AI đọc tốt nhất vì chúng vốn đã là “chữ thuần”, không cần dịch qua bước nào.
Với dân tài chính, file .csv (kiểu xuất ra từ Excel, chỉ có số và chữ, không có màu sắc hay công thức) là lựa chọn lý tưởng khi muốn AI phân tích bảng số liệu, danh mục đầu tư hay dữ liệu giá cổ phiếu.
🟡 Nhóm 2 - Đọc được nhưng hay bị sai, nhớ kiểm tra lại
File PDF là thứ dân tài chính dùng nhiều nhất - BCTC, hợp đồng, báo cáo thường niên - nhưng cũng là thứ AI hay đọc nhầm nhất. Chữ thì AI đọc được, nhưng gặp bảng số liệu nhiều cột, chú thích dài hay tiêu đề lặp đi lặp lại qua nhiều trang, AI rất dễ đọc nhầm thứ tự hoặc ghép sai dòng. File PDF chụp từ bản in (không phải bản điện tử gốc) thì còn tệ hơn nữa.
File Word (.docx) cũng tương tự - AI đọc được phần nội dung chính, nhưng các ghi chú, lịch sử chỉnh sửa hay ô gộp trong bảng thường bị bỏ qua mà không báo lỗi.
🟠 Nhóm 3 - Cẩn thận, dễ mất dữ liệu quan trọng
File Excel (.xlsx) là thứ dân tài chính mở ra mỗi ngày - và cũng là thứ dễ gây hiểu nhầm nhất khi đưa cho AI. AI chỉ đọc được con số hiển thị trong ô, còn công thức tính toán phía sau thì mất sạch. Nghĩa là nếu bạn có một file DCF hay bảng tính EBITDA với đủ loại công thức phức tạp, AI chỉ thấy kết quả cuối, không thấy cách tính. Sheet ẩn, pivot table, định dạng màu sắc cũng đều không truyền được sang.
Ngoại trừ: Nếu bạn đang dùng AI được tích hợp thẳng vào Excel (như Claude in Excel hay Copilot) thì khác - những công cụ này kết nối trực tiếp với phần mềm nên xử lý tốt hơn nhiều. Còn upload file lên web chat thông thường thì giới hạn trên vẫn áp dụng.
File PowerPoint (.pptx) thì AI đọc được chữ trong slide, nhưng không hiểu được bố cục, biểu đồ hay mối liên hệ giữa các phần.
🔴 Nhóm 4 - Không nên tin vào kết quả
Ảnh chụp BCTC bằng điện thoại, scan hóa đơn, hay file nén .zip. AI có thể cố đọc, nhưng với bảng số liệu dày đặc thì sai nhiều hơn đúng. Không nên dùng cho phân tích nghiêm túc.
Mẹo 3 bước cho dân tài chính hay làm việc với Excel
Khi muốn AI phân tích bảng số liệu của bạn - dù là bảng so sánh chỉ số tài chính, tổng hợp BCTC hay danh mục cổ phiếu - đừng upload thẳng file .xlsx. Thay vào đó, hãy chuyển bảng sang dạng văn bản có cấu trúc trước. Có một trang web làm việc này trong vài giây:
- Bước 1: Bôi đen và copy vùng dữ liệu cần phân tích trong Excel.
- Bước 2: Mở tabletomarkdown.com, paste vào - ra kết quả ngay (miễn phí, không cần đăng ký).
- Bước 3: Copy kết quả và paste thẳng vào chat AI.
Lưu ý: Đừng paste dữ liệu khách hàng hay số liệu nội bộ nhạy cảm lên các công cụ online này.
Markdown là gì và tại sao cần biết?
Kết quả từ trang tabletomarkdown.com trả về là dạng “Markdown” - bạn sẽ thấy bảng được viết bằng ký hiệu gạch ngang và dấu |. Trông hơi lạ, nhưng đây chính xác là thứ AI đọc tốt nhất.
Markdown ra đời năm 2004 với một mục tiêu đơn giản: viết văn bản có cấu trúc mà không cần phần mềm đặc biệt nào để mở. Hai mươi năm sau, nó trở thành “ngôn ngữ chung” giữa người và AI.
Bạn đang thấy Markdown mỗi ngày mà không biết. Khi ChatGPT hay Gemini trả lời có tiêu đề đậm, có gạch đầu dòng, có chữ in đậm - tất cả đều là Markdown đang được hiển thị. Khi bạn copy câu trả lời đó ra email hay Word và thấy ký hiệu **, ## lạ lẫm - đó là Markdown chưa được “dịch” sang định dạng đẹp, không phải lỗi.
Cú pháp cơ bản, không cần học nhiều:
- In đậm:
**chữ này** - Tiêu đề:
## Tiêu đề - Gạch đầu dòng:
- mục 1 - File lưu bằng đuôi
.md
Muốn lưu và đọc file .md thì dùng gì?
Hãy dùng Obsidian - miễn phí, không cần đăng ký. Tải về tại: obsidian.md/download
Đây là phần mềm ghi chú được dân công nghệ dùng rất phổ biến. Ngoài đọc file .md, bạn còn có thể dùng nó để xây kho kiến thức cá nhân: lưu prompt hay, ghi chú phân tích từng doanh nghiệp, lưu nghiên cứu ngành.
Điểm đặc biệt: Obsidian chạy hoàn toàn trên máy bạn, không lưu gì lên cloud của ai. Data là của bạn, nằm ở trên máy bạn.
Tips dùng Obsidian đồng bộ trên nhiều máy tính:
- Tạo một thư mục trong Google Drive, lưu toàn bộ file
.mdvào đó. - Bật Google Drive đồng bộ về máy tính (cài app Google Drive trên máy).
- Mở Obsidian, chọn thư mục Google Drive đó làm nơi lưu file (Vault).
Sau khi làm xong, bạn được tất cả những thứ này cùng lúc:
- Dùng được trên mọi máy tính, chỉ cần đăng nhập Google Drive.
- Vẫn đọc được khi không có mạng (vì file đã sync về ổ cứng).
- Không lo mất dữ liệu khi máy hỏng - mọi thứ đã có file backup trên Google Drive.
- Lỡ xóa nhầm hay sửa sai thì vào Google Drive khôi phục lại phiên bản cũ dễ dàng.