thực ra thì giờ công cụ AI nó còn có thể ra kết quả là cây ngữ pháp luôn rồi, chỉ cần thêm nghĩa + đảo vị trí là đc, có khi còn ngon hơn máy dịch chivi bây giờ. cơ mà đáng tiếc là cái có bản offline là hanlp thì nó chậm + không quá chính xác, cái texsmart chính xác hơn (cũng chậm) nhưng chỉ có phiên bản api online, gọi nhiều nó ban IP, cũng không tinh chỉnh dc (ví dụ có một vài bộ có tên người đặc dị thì bản offline nó sẽ cho phép thêm từ điển custom, bản online hiển nhiên không có hàng ngon thế). chắc tầm 4 5 năm nữa sẽ có các tool mới xịn hơn giải quyết hết mấy vấn đề này mà vẫn free :)
mấy bộ đó còn đở , như bộ chuế tế với phản loạn đại ma vương , tác viết cao siêu quá giờ éo biết end kiểu gì
Mẹ chuế tế giờ đang làm cải cách ruộng đất tiến lên chủ nghĩa xã hội, chắc hàng ngày lão tác uống trà sáng tác trong đồn quá
Ta có thể hồi đương (giống load save) mà trong thế giới linh dị quỷ quái nữa . Tay nào chuyên đọc cái này thử thuốc đi . Ta ko tu cái này coi mấy chục chương hết gặp ma này tới ma khác ghê quá chạy .
khả năng là đíu ăn thua, tôi hôm nọ đọc thấy chúng nó train bằng Tesla V100 32GB mà phải cắm máy 1 ngày cho cái bước đơn giản nhất. Mấy con consumer kiểu này chắc phải cắm cả tuần hoặc hơn. còn train như thế nào thì tôi chả có gpu khoẻ cho nên chưa tìm hiểu, nhìn qua thì thấy vài công cụ có tool sẵn chỉ việc feed data vào, nhưng vài cái khác cần train 2 bước thì loằng ngoằng hơn. đợi lúc nào rảnh tìm hiểu sau. nói đến tôi cũng chả học kỹ ML, nhiều cái đọc paper xong cũng chỉ hiểu đại khái, nhìn công thức thì như mù, đang tính xem có đáng học tử tế không ps: https://github.com/hankcs/HanLP/tree/master mà train data ngoài vụ chuẩn bị dữ liệu còn phải sửa thông số sao cho nó hợp nữa, không phải cứ cắm máy là chạy đâu.