เขียนโปรแกรมตัดคำภาษาไทยด้วย kucut โดยใช้ Ipython notebook


กล่าวนำ
โปรแกรมตัดคำภาษาไทยมีหลายตัว วันนี้ใช้ของ kucut ซึ่งพัฒนาด้วยวิธีการเรียนรูแบบไมใชตัวอยาง (Unsupervised Machine Learning) โดย ม.เกษตรศาสตร์

การดำเนินการ
1. ดาวน์โหลด kucut จาก https://drive.google.com/…/0B-tIf-y_iBWuRmllQkdELVZkQ…/view…

2. ขยายไฟล์ในขั้นที่ 1

3. ไปยังไดเร็คทอรี่ในขั้นที่ 2 และติดตั้งด้วยคำสั่ง
$ sudo python setup.py install

4. เปิด ipython ด้วยคำสั่ง
$ ipython notebook

5. ทดสอบเขียนโปรแกรมตัดคำ
from kucut import SimpleKucutWrapper as KUCut
myKUCut = KUCut()
result = myKUCut.tokenize([u”ประเทศไทยนี้ยืนประเทศเพื่อสืบพระพุทธศาสนาให้ครบห้าพันปี”])
print u”\n”.join(
… [u”\n”.join(
…… [u” “.join(
………… [w for w in line])
…………… for line in p])
……… for p in result])

6. เสร็จเรียบร้อย ครับ 

======================
สรุป
======================
วันนี้ได้รู้วิธีการเขียนโปรแกรมตัดคำภาษาไทยด้วย kucut หวังว่าจะเป็นประโยชน์ไม่มากก็น้อยครับ

>

Mayong_ness

อยากเขียนเรื่องราวข้อมูลต่างๆ เพื่อให้คนที่สนใจได้เข้ามาอ่าน..อาจจะไม่ได้เขียนทุกวัน..นานๆที่มาเขียนนะคับ..ถ้าข้อมูลใดไม่ถูกต้องก็ ติชมกันได้นะคับ..

บทความอื่นๆที่น่าสนใจ...