Skip to main content

Membuat N-Grams : Unigram, Bigram, Trigram Pada Java

N-Grams adalah potongan sejumlah karekter dari suatu string tertentu atau potongan jumlah (n) kata dari suatu kalimat. Jadi setiap string yang diproses akan menjadi potongan-potongan n kata.
N-grmas merupakan dasar dari pengolahan kalimat. Dengan implementasi N-Grams sebuah aplikasi dapat dikembangkan untuk spelling correction, word breaking dan text summarization. Bahkan Microsoft dan Google menggunakan model ini untuk pengembangan web mereka.

N-Grams ini akan mengambil sejumlah kata yang kita butuhkan dari sebuah kalimat. Seperti contohnya kalimat "Melody nampak sangat cantik", maka bentuk N-Grams dari kalimat tersebut adalah :
  1. Unigram : Melody, nampak, sangat, cantik
  2. Bigram    : Melody nampak, nampak sangat, sangat cantik
  3. Trigram  :  Melody nampak sangat, nampak sangat cantik
  4. dst,.
Lalu bagaimana mengimplementasikannya pada sebuah pemrograman? Salah satu bahasa yang bisa digunakan untuk N-Grams ini adalah Java. Berikut adalah kodenya :

import java.util.ArrayList;
import java.util.List;
import java.util.Scanner;

public class NGram {

    public static List ngrams(int n, String str) {
        List ngrams = new ArrayList();
        String[] words = str.split(" ");
        for (int i = 0; i < words.length - n + 1; i++) {
            ngrams.add(concat(words, i, i + n));
        }
        return ngrams;
    }

    public static String concat(String[] words, int start, int end) {
        StringBuilder sb = new StringBuilder();
        for (int i = start; i < end; i++) {
            sb.append((i > start ? " " : "") + words[i]);
        }
        return sb.toString();
    }

    public static void main(String[] args) {

        String kalimat;
        int pilih = 0;
        

        while (pilih != 4) {
            Scanner s = new Scanner(System.in);
            Scanner s2 = new Scanner(System.in);
            System.out.println("1. Unigram");
            System.out.println("2. Bigram");
            System.out.println("3. Trigram");
            System.out.println("4. Exit");
            System.out.print("Plih N-Gram : ");
            pilih=s.nextInt();
            if (pilih > 0 && pilih < 5 && pilih!=4) {
                System.out.print("Masukan Kalimat : ");
                kalimat = s2.nextLine();
                
                if (pilih != 4) {
                    for (int n = pilih; n <= pilih; n++) {
                        for (String ngram : ngrams(n, kalimat)) {
                            System.out.println(ngram);
                        }
                        System.out.println();
                    }
                }
            }else{
                if (pilih != 4) {
                 System.out.println("Input Salah..");
                 System.out.println("=============");
                }
            }
        }
    }
}

Itulah cara Membuat N-Grams : Unigram, Bigram, Trigram Pada Java.

Terima kasih.

Comments

Popular posts from this blog

Pembahasan Dan Contoh Algoritma Array

Array adalah type data yang mengacu sekumpulan elemen  bertipe sama melalui indeks. Memiliki sifat tersusun secara terurut dan memiliki indeks. Contoh :   A : array[1..10] of char  TNamaHari : array[1..7] of string TJumHari : array[1..12] of integer Contoh Pemakaian Array Program NamaHari Kamus TNamaHari :  array[1..7] of string HariKe : integer Algoritma   TNamaHari[1]←”Senin”   TNamaHari[2]←”Selasa”   TNamaHari[3]←”Rabu”   TNamaHari[4]←”Kamis”   TNamaHari[5]←”Jumat”   TNamaHari[6]←”Sabtu”   TNamaHari[7]←”Minggu”   input (HariKe)   output(TNamaHari[HariKe]) Contoh di atas adalah contoh array dengan jumlah indeks 7, dan setiap indeks diisi dengan nama-nama hari. Mengisi array bisa dilakukan dengan membuat sistem/algoritma pengulangan sampai jumlah indeks array yang dibutuhkan atau tersedia. Lalu disetiap pengulangan dimasukan nilai data pada indeks array. Skema Pemrosesan Array Skema ...

Pemrograman Java : Cara getText dan setText Pada Java GUI

Pada Java GUI untuk mendapatkan text yang user input kamu harus mengambil text dari text area atau bisa juga text field. Untuk melakukannya bisa menggunakan fungsi getText() yang ada pada Java. getText() adalah fungsi yang ada pada Java untuk mengambil teks yang diinput pada form. Lalu untuk memunculkan sebuah teks pada text area atau text field  dapat menggunakan fungsi setText(). Akan diberikan contoh form sebagai berikut untuk lebih memahami penggunaan setText() dan getText() pada Java. Berikut adalah Cara getText dan setText Pada Java GUI : Buatlah form pada JFrame seperti gambar diatas. Caranya hanya tinggal klik kanan pada package yang diinginkan new-->JFrame Form... Lalu buat form seperti berikut: Berikan nama variabel pada text field  sesuai kegunaan. Contohnya text field  jurusan akan diberi nama variabel "jurusan". Caranya klik kanan pada text field yang dikehendaki lalu pilih Change variable name. Ini untuk memudahkan menggunaka...

Pemrograman Java : Cara Membuat Matriks Pada Java

Pengertian umum dari matriks adalah type data yang mengacu sekumpulan elemen bertipe sama melalui 2 indeks (baris & kolom). Atau ada juga yang mengartikan matriks sebagai array dua dimensi. Jika array satu dimensi hanya terdiri satu baris dan beberapa kolom sedangkan matriks memiliki baris dan kolom lebih dari satu. Jika ingin mendapat dasar pembahasan dan contoh algoritma matriks bisa dilihat pada artikel  Pembahasan Dan Contoh Algoritma Matriks . Dalam artikel tersebut dijelaskan konsep dasar dari algoritma matriks tanpa  berkaitan dengan bahasa pemrograman apapun. Kembali ke pembahasan kita kali ini, yaitu membuat Cara Membuat Matriks Pada Java. Berikut adalah code seluruh program dari pembuatan matriks pada java. import java.util.Scanner; public class Array { public static void main(String[] args) { int jumlahBaris, jumlahKolom; Scanner scanner = new Scanner(System.in); System.out.print("Masukan Jumlah indeks baris martriks...