Hỏi về tự động hóa n8n và AI, OCR

Thảo luận trong 'Thư giãn' bắt đầu bởi Bộ kiểm soát chính tả, 24/9/25.

  1. Bộ kiểm soát chính tả

    Bộ kiểm soát chính tả Chánh tả nà cuột xống

    Tham gia ngày:
    14/5/20
    Bài viết:
    1,478
    Chữ viết tay của em đề cập ở đây 99% là chữ viết dạng số, nên em nghĩ là sẽ đơn giản hơn rất nhiều so với chữ viết latin. Ví dụ như sau:
    upload_2025-9-24_17-12-26.png
    Nếu AI chưa đủ tốt để đọc các con số này, thì em có thể huấn luyện cho nó bằng cách tạo 1 AI agent hay machine learning ko? Nếu được thì làm thế nào? Có nên đặt ra quy tắc viết cho anh em hiện trường để bản ghi dễ nhận diện hơn ko?
    1. Office 365 em có rồi, nhưng ý bác là phải thêm công cụ gì ko? Power Automate như bác trên nói, hay Copilot với ChatGPT addon?
    2. Em thử quẳng 1 file mấy trăm trang lên ChatGPT (em xài cả bản Plus rồi ) thì nó tìm dữ liệu khá là lởm, cảm giác nó ko có khả năng đọc được hết tài liệu, vì khi em thử hỏi 1 số thứ trong đó thì nó ko tìm ra.
    3. Như em hỏi ở trên
    4. Ví dụ như mặt cắt 1 dầm trên autocad như sau: EM muốn nó nhận diện và hiểu được là đây là mặt cắt 1 cái dầm, có 5 thanh thép (1+2+2 thanh d20) ở phía trên, sau đó tự động copy vào bảng tính. Vậy thì tool mà bác nói đến có nhận diện được vậy ko?
    upload_2025-9-24_17-19-3.png
    3. End-user sẽ tiết kiệm được thời gian và công sức để dành cho việc khác đó bác, cũng chưa rõ ý bác hỏi có phải là vậy ko?
     
  2. lovelybear

    lovelybear John Marston's Redemption Lão Làng GVN

    Tham gia ngày:
    2/1/05
    Bài viết:
    21,832
    1. Power Automate, Copilot là những tính năng có sẵn trong Ofice 365 rồi. Nói chung là chưa xài tới nên nghĩ nó riêng.
    2. Chat GPT hiện nay theo kinh nghiệm thì nó chỉ hữu dụng với ai có kỹ năng cơ bản đã, chứ như fen thì chưa nắm rõ thì nên đi từ cơ bản
    3. Chữ viết chưa thử nhiều (vì 1 số người viết xấu lắm), nhưng Office 365 cũng có tính năng sẵn là đọc qua hình ảnh và tự trả về data, nên thử
    4. Cái số 4 thì không được đâu, nếu theo cách hiểu của fen.
    Nhưng nếu làm đúng trình tự là trên bảng vẽ có thêm 1 bảng số liệu, như trường hợp của bạn là bảng BOM (bill of Material), cả AutoCAD lẫn Inventor đều xuất tự động ra bản vẽ lẫn ra Excel được. Tính năng là vậy, tuy nhiên mình không phải thiết kế nên không trực tiếp làm cho bạn xem được, chứ thực tế chỗ cũ mình làm thiết kế xuất ra và mình chỉ kéo data về excel thôi.

    ==> Theo kinh nghiệm cá nhân, ta chưa cần đầu tư tiền vào "AI" mà chỉ cần cải tiến quy trình trên những cái đang có sẵn mà xưa giờ chưa biết dùng tới thôi, rồi upgrade từ từ, cái này thì mình có kn làm và đang làm, có thể góp ý sâu được worry-100

    Rất mong gặp nhau làm 1 chầu đút đ... nhầm cà phê 5ncyve-png.604323/
     
    leonidas0411 thích bài này.
  3. draelthas

    draelthas Red, Pokémon champion Lão Làng GVN

    Tham gia ngày:
    3/11/10
    Bài viết:
    7,463
    Về mặt nhập liệu thì tốt nhất ko xài AI scan, sai 1 li đi 1 dặm.
    Nên nhờ cty build cho app thích hơp, cài máy tính bảng rồi nhập số liệu rồi save trên máy hay server.
    Giảm quy trình hay sức người phải giảm từ cái nhỏ nhặt xong nâng cấp lên từ từ. Tạm thời đừng sử dụng AI cho những vấn đề scan data kĩ thuật. Đưa cho AI làm phải có người xác nhận lại mới dc chứ ko kiểm tra là toang
     
  4. lovelybear

    lovelybear John Marston's Redemption Lão Làng GVN

    Tham gia ngày:
    2/1/05
    Bài viết:
    21,832
    Chuẩn, mình đồng ý là muốn xài AI phải có 1 ông đủ trình để kiểm tra, ko biết gì mà áp dụng AI thì nó dắt đi tới đâu luôn cũng ko biết
     
  5. Hoàn Gia Sắc

    Hoàn Gia Sắc You Must Construct Additional Pylons Lão Làng GVN

    Tham gia ngày:
    14/9/09
    Bài viết:
    8,563
    Dĩ nhiên phải tích hợp thêm ChatGPT. Nếu dùng ChatGPT mà không hiệu quả thì có dùng n8n cũng không hơn kém nhau nhiều đâu.
    n8n chẳng qua là low-code workflow tool thôi. Chú muốn có AI thì vẫn phải mua API Key của OpenAI, DeepSeek hay Claude tích hợp vào, rồi custom thêm API của bên thứ 3, thiết kế flow step by step. Ví dụ:
    - Gọi API scan AutoCAD, chữ viết tay
    - Gọi ChatGPT để summarize đoạn text/ảnh scan được
    - Chuyển thành data insert vào database
    Trước hết là phải phân tích nghiệp vụ, xem trong kho plugin của thằng n8n có hết plugin cần thiết không. Nếu không có thì phải code thêm plugin. Nếu plugin là API của bên thứ 3 thì xem xét cost license thế nào.
    Nếu có hết điều kiện cần thì mới bắt đầu demo thử workflow đơn giản trước rồi cải tiến thêm từ từ
     
  6. Rekka

    Rekka Mayor of SimCity Lão Làng GVN

    Tham gia ngày:
    22/3/03
    Bài viết:
    4,121
    Nơi ở:
    .....
    kiếm mấy cái làm ChatGPT wrapper tự động thôi
    self host thì Open webUI. Còn dịch vụ thấy chúng nó bảo zapier dễ xài hơn n8n nếu yêu cầu ko cao.
     
    Chỉnh sửa cuối: 24/9/25
    Bộ kiểm soát chính tả thích bài này.
  7. sonvn

    sonvn Mega Man Lão Làng GVN

    Tham gia ngày:
    8/8/05
    Bài viết:
    3,244
    Thêm link về ocr cho fen tham khảo, nhưng không khuyến khích làm vì nhìn vào cái ảnh kia đã có mấy chỗ không ổn rồi, người nhìn số còn sai nữa là dùng ocr.

    https://viblo.asia/p/training-lai-tesseract-voi-du-lieu-duoc-custom-MkNLrZqbLgA

    https://www.codeproject.com/article...racter-Recognition?msg=2559322&PageFlow=Fluid
     
    Bộ kiểm soát chính tả thích bài này.
  8. lehmanbear

    lehmanbear Kỹ sư gọi bưởi Lão Làng GVN

    Tham gia ngày:
    12/12/10
    Bài viết:
    19,124
    1 mặt cắt chưa có thông tin chiều dài thanh thép.
    Giờ phải tìm bv có mặt bằng để biết chiều dài thanh. Thà xây quy trình vẽ trên revit có đủ thông số còn hơn.
     
    jumper thích bài này.
  9. BillGatesBoss

    BillGatesBoss Ryu & Ken ⚔️ Dragon Knight ⚔️ Lão Làng GVN

    Tham gia ngày:
    26/3/05
    Bài viết:
    16,677
    2. Riêng cái chatgpt mình làm cực nhiều thì có thể nói thằng này (bản plus) cũng vẫn rất nhiều hạn chế, số token nó có thể đọc được khoảng đâu đó 10k thôi (bản cũ hình như 100k, sau nó update lên gpt5 là bóp hết lại). So với những thằng free và đang cho dùng thoải mải thì deepseek, claude hay thậm chí là gemini, grok đều vượt trội hơn về số lượng token.

    fence có thể thử bản pro $200/mo xem sao
     
  10. heoconbusua

    heoconbusua The Pride of Hiigara Lão Làng GVN

    Tham gia ngày:
    18/5/06
    Bài viết:
    9,025
    Nơi ở:
    Ho Chi Minh City
    Cái scan hình ảnh để lấy text mình thấy chua đó, đợt thử xài tool Google mà nó đọc cũng sai búa xua.
     
  11. scuuby

    scuuby Ryu & Ken ⛨ Empire Gladiator ⛨ Lão Làng GVN

    Tham gia ngày:
    2/8/06
    Bài viết:
    16,649
    cán bộ xuất số liệu kiểm định à,
    nếu toàn text thôi thì scan + AI chắc ít sai.
    n8n setting hơi phức tạp tí,
    nếu tác vụ ít mà mì ăn liền thì có thể dùng make.io cho dễ
     
    Bộ kiểm soát chính tả thích bài này.
  12. vondutch2550

    vondutch2550 Samus Aran the Bounty Hunter ➹ Marksman ➹ Lão Làng GVN

    Tham gia ngày:
    30/3/08
    Bài viết:
    6,063
    Scan ảnh viết tay nhận diện con số dùng cái nào không biết. trên Excel 365 thì bỏ đi. Lúc trước thường xuyên dùng nó trích data tọa độ trên sổ đỏ. Toàn số đánh máy mà nó nhận diện còn sai từa lưa toàn phải dò lại
     
  13. BÔ-MAN

    BÔ-MAN C O N T R A Waiting to respawn

    Tham gia ngày:
    17/11/22
    Bài viết:
    1,648
    Nơi ở:
    toilet
    nói con AI nó build cho cái app nhập liệu thì khả thi hơn đấy
    mà giờ dùng appsheet tự build cũng nhanh, 1 buổi là xong, lâu ở chỗ nghĩ xem cần/muốn build cái gì :))
    appsheet cũng có cả tích hợp OCR nhưng phải bỏ tiền nên cũng chưa dùng thử
     
    heoconbusua thích bài này.
  14. quangtn

    quangtn Wang Short Trymn Lão Làng GVN

    Tham gia ngày:
    14/8/06
    Bài viết:
    3,501
    Nơi ở:
    six fit under

    1. Ở Office365 có sẵn đó, gọi là AI Hub. Có thể huấn luyện AI theo template PDF của mình. Nhưng chữ viết tay thì bỏ đi, có những việc thuộc về đặc thù của môi trường lao động, không thể áp dụng triệt để công nghệ vào được. Nếu có thể chấp nhận sai số của nó thì có thể dùng.

    4. Trước solution bên mình có làm về dạng gần như thế này. Đọc thông số trên bản vẽ của Tool( dao cơ khí gia công cnc ) , Lấy các thông số cơ bản về lưỡi cắt, đường kính... để đưa vào phần mềm tự động thiết kế phần còn lại. Thư viện trên Python có loại hỗ trợ đọc được khá nhiều định dạng. Nhưng bắt buộc phải set gốc để làm mốc thì mới biết đọc từ đâu. Cái khó là nếu như bản vẽ không có mẫu chung như thế thì khoai , khả năng chỉ có train AI đọc thôi.
     
    Bộ kiểm soát chính tả thích bài này.
  15. vhbdragon

    vhbdragon Mario & Luigi Lão Làng GVN

    Tham gia ngày:
    12/7/05
    Bài viết:
    795
    Nơi ở:
    Ulitsa Ilyinka, 23 103132, Moscow Russia
    Nói chung vụ viết tay số liệu thì khả năng model trích xuất sai nhiều lắm.
    mất công rà soát các thứ.

    Tốt nhất bác bắt điền theo format thống nhất vào sheet thôi là đơn giản nhất.
    Mấy cái phiên phiến mới dùng OCR được, chứ số liệu chính xác thì không nên.

    Công rà soát tốn ngang công nhập liệu thì không đáng đâu.
     
  16. ahcute

    ahcute The Warrior of Light Lão Làng GVN

    Tham gia ngày:
    6/5/11
    Bài viết:
    2,001
    Số hóa cả quy trình đi, để data tự sinh ra trong quá trình làm nghiệp vụ luôn chứ cứ làm thủ công rồi ngồi nhập liệu gì cho khổ
     
    scuuby thích bài này.
  17. Bộ kiểm soát chính tả

    Bộ kiểm soát chính tả Chánh tả nà cuột xống

    Tham gia ngày:
    14/5/20
    Bài viết:
    1,478
    Thực ra số hóa thì cũng được, nhưng người làm lại toàn người có tuổi ko rành công nghệ, họ ghi chép xong thì chụp ảnh lại cho bộ phận văn phòng ở nhà nhập liệu. Em có thử test bằng OCR của ChatGPT thì nếu chịu khó viết đẹp thì kết quả chuẩn 100%, còn ngoáy tý cũng được hơn 95%. Để giảm thiểu sai sót này thì em dự định sẽ sử dụng OCR của cả ChatGPT và Claude hoặc Gemini độc lập nhau, nếu số liệu của 2 con AI ko khớp chỗ nào thì sẽ kiểm tra lại. Ngoài ra số liệu có xu hướng biến đổi dần dần theo hướng tăng lên, vậy nên check số liệu mà có bất thường thì sẽ bắt double check 1 lần nữa.
    Nghe hơi vòng vèo nhưng mà em nghĩ sẽ ổn.

    Hiện tại thì em đang theo hướng sử dụng Python để viết mini app hơn là sử dụng n8n cho những công đoạn xử lý số liệu, n8n nghe no code với low code thì rất hay, nhưng thực tế phức tạp hơn mình tưởng nhiều quá. Các bước cần can thiệp AI thì mới bắt buộc phải dùng n8n.
     
  18. ahcute

    ahcute The Warrior of Light Lão Làng GVN

    Tham gia ngày:
    6/5/11
    Bài viết:
    2,001
    Ocr mà dùng mấy con chatbot nghe nó cứ bị thiếu reliable thế đ nào ấy
     
  19. Bộ kiểm soát chính tả

    Bộ kiểm soát chính tả Chánh tả nà cuột xống

    Tham gia ngày:
    14/5/20
    Bài viết:
    1,478
    Thực tế thì ngoại trừ việc tự training bằng local host với hàng trăm nghìn số viết tay của một số người cụ thể thì Claude và OpenAI lại là mạnh nhất về OCR, thậm chí trong điều kiện ảnh ko rõ nét, mất sáng.
    Mấy cái EasyOCR, tesseract ko ăn thua, đọc số in còn khó nữa là chữ viết tay.
     
  20. Red Mosnter

    Red Mosnter Red, Pokémon Champion ‍ ⚚ Mystic Mage ⚚ GVN Dalit

    Tham gia ngày:
    20/8/03
    Bài viết:
    45,493
    Google Image best, from người hay chuyển giáo trình sang file mềm dễ tra cứu
     

Chia sẻ trang này