Skip to content

Latest commit

 

History

History
7 lines (6 loc) · 431 Bytes

README.md

File metadata and controls

7 lines (6 loc) · 431 Bytes

NLP - Tokenizer

A Vietnamese word segmentation tool in Java -JNI

Giới thiệu

  • Đây là phần mềm tách từ dành cho tiếng Việt. Được sửa đổi để tương thích với Java , sử dụng JNI. Ngoài ra, chỉnh sửa code C/C++ để có thể sử dụng trong chế độ Multi Thread
  • Nguồn gốc được lấy tại: http://viet.jnlp.org/dongdu. Bao gồm cả tài liệu và mã nguồn.