Anggri Yulio P
Web Developer, sekarang mulai jatuh hati pada Computer Vision.
May 9, 2018 12:30 am

Menambah Stopword Pada Python Sastrawi

Setelah sekian lama tidak menulis karena mengurus urusan kantor yang bejibun, lalu mengingat banyak nya email masuk terkait penggunaan Python Sastrawi mau tak mau saya sempatkan jugalah untuk menulis kembali. Pertanyaan ini sudah beberapa kali masuk ke email saya tentang cara menambahkan Stoplists pada python sastrawi.

Untuk penggunaan stopword pada python dengan menggunakan library sastrawi bisa dilihat pada tulisan saya sebelumnya tentang Stopword Removal Bahasa Indonesia dengan Python Sastrawi

Pada dasarnya kamus stopword pada python sastrawi dikumpulkan dalam dan disimpan ke dalam list, silahkan lihat disini . Untuk menambah list storpword baru pun cukup mudah, ya kita tinggal mengubah saja file StopWordRemoverFactory.py dan masalah pun selesai 😀

Tapi tentu saja cara lain yang setidaknya sedikit lebih elegan, anggap saja kita punya kasus dimana stopword diambil dari resource data yang berbeda dan kita diharuskan menambah stopword tersebut secara dinamik atau apalah kasus sejenis lainnya.

Seperti yang sudah saya jelaskan sebelumnya, bahwa stopword tergabung dalam sebuah list, jadi kita cukup menambah kata baru kedalam list tersebut. Lihat kode dibawah :

 

 

Intinya hanya menambah list yang sudah ada dengan list baru yang berisi stopword tambahan  stop_factory.get_stop_words()+more_stopword Cukup mudah bukan ? Untuk kasus lainnya kita bisa menambah sumber stopword yang berbeda, misalnya dari file csv, database atau apalah namanya 🙂 Oh iya, untuk pengolahan file csv, silahkan cek tulisan saya tentang Manipulasi file csv dengan Python.

%d bloggers like this: