Ingin mendapatkan informasi terkini langsung ke WhatsApp Anda? Ikuti Channel saya!

Mengatasi Gagal Ekstrak Dataset Scopus New Version di OpenRefine

Pelajari langkah-langkah efektif ekstraksi dan pembersihan data dari Scopus versi baru menggunakan OpenRefine.


Dalam era yang semakin canggih ini, analisis bibliometrik menjadi sebuah alat yang tak tergantikan bagi peneliti dan akademisi dalam mengukur dampak serta jejak karya ilmiah. Namun, tidak jarang tantangan teknis menghadang ketika berhadapan dengan dataset besar yang diunduh dari sumber terkemuka seperti Scopus. Salah satu kendala umum yang muncul adalah kesulitan dalam ekstraksi dan pembersihan data, terutama ketika menggunakan versi baru dari platform Scopus. 

Dalam tutorial yang akan diuraikan dalam artikel ini, saya akan memandu langkah demi langkah bagaimana mengatasi kendala ekstraksi dataset yang diunduh dari Scopus versi baru, khususnya dalam konteks membersihkan data menggunakan alat bantu OpenRefine.

Mengingat bahwa versi baru Scopus memungkinkan pengunduhan metadata hingga 20.000 dokumen dalam satu kali unduhan, artikel ini akan menjadi panduan berharga bagi para peneliti yang ingin memaksimalkan analisis bibliometrik mereka tanpa terjebak dalam kerumitan struktur data yang berbeda dengan versi sebelumnya. Dengan pemahaman yang mendalam tentang teknik pembersihan data menggunakan OpenRefine, tantangan ini dapat diatasi secara efektif.

Langkah 1: Pengunduhan Metadata dari Scopus Versi Baru

  1. Buka platform Scopus dan akses halaman yang berisi dataset yang ingin diunduh. 
  2. Pilih opsi untuk mengunduh metadata dokumen. Ingatlah bahwa versi baru Scopus memungkinkan pengunduhan hingga 20.000 metadata dokumen dalam satu kali unduhan. 
  3. Setelah proses pengunduhan selesai, simpan file metadata dalam format CSV.

Langkah 2: Mengonversi File CSV ke Format XLS

  1. Buka browser dan akses situs web Convertio di https://convertio.co
  2. Klik tombol "Choose Files" atau seret-dan-lepaskan (drag and drop) file CSV yang telah Anda unduh dari Scopus versi baru. 
  3. Setelah file diunggah, pilih format output "XLS" dari opsi konversi yang tersedia. 
  4. Klik tombol "Convert" untuk memulai proses konversi. Tunggu proses konversi hingga selesai.

Langkah 3: Menyimpan dan Mengimpor File XLS ke OpenRefine

  1. Setelah proses konversi selesai, klik tombol "Download" untuk mengunduh file XLS yang telah dikonversi ke komputer Anda. 
  2. Buka aplikasi OpenRefine dan klik "Create Project" di bagian atas halaman. 
  3. Pilih opsi "Get data from this computer" dan unggah file XLS yang baru saja Anda unduh. 
  4. Beri proyek Anda nama yang sesuai dan klik tombol "Next." Sekarang, proses ekstraksi data telah berhasil, sama seperti dataset Scopus versi lama.

Langkah 4: Pembersihan Data dengan OpenRefine

  1. Anda akan diarahkan ke tampilan data di OpenRefine. Lanjutkan pembersihan seperti yang biasa Anda lakukan pada Scopus versi lama.
  2. Identifikasi kolom-kolom yang perlu dibersihkan dan gunakan berbagai transformasi yang sudah Anda kuasai sebelumnya, seperti merapikan keywords, nama penulis dan afiliasinya, menghapus spasi ekstra, dan lain-lain. Untuk tutorial yang lebih lengkap, Anda dapat mengunjungi tautan ini.

Langkah 5: Verifikasi dan Ekspor Data yang Telah Dibersihkan

  1. Setelah selesai melakukan pembersihan, pastikan untuk memeriksa hasilnya dengan menggunakan fitur "Preview" di OpenRefine.
  2. Jika hasilnya sudah sesuai, klik pada tautan "Export" di bagian kanan atas halaman untuk mengunduh dataset yang telah dibersihkan dalam format CSV 

Catatan Penting

Ingat!!! Pastikan untuk menyimpan salinan asli file CSV yang diunduh dari Scopus versi baru sebagai cadangan. Jika terdapat perbedaan dalam struktur data setelah konversi ke format XLS, pastikan untuk memeriksa kolom-kolom dan pemisah data yang sesuai sebelum melanjutkan dengan pembersihan di OpenRefine.

Sampel Dataset

Jika Anda tertarik untuk membandingkan dataset unduhan dari Scopus versi lama dengan versi terbaru, silakan unduh melalui tombol di bawah ini.

new-scopus_social-annotation.csv 1.19MB

Penutup

Sebagai penutup, semoga tutorial yang telah dibahas mengenai cara mengatasi kendala dalam ekstraksi dataset dari Scopus versi baru menggunakan OpenRefine dapat memberikan wawasan penting bagi para akademisi dan peneliti. Menangani kegagalan ekstraksi secara efektif adalah langkah krusial menuju analisis bibliometrik yang akurat dan bermakna. Namun, penting untuk diingat bahwa salah satu kesalahan umum yang kerap muncul dalam analisis bibliometrik terletak pada tahap pembersihan data. Oleh karena itu, hati-hati dan teliti dalam melaksanakan langkah data cleaning amatlah penting untuk memastikan bahwa hasil riset Anda memiliki keabsahan dan keandalan yang tinggi.

Jika Anda bermaksud melanjutkan dengan analisis bibliometrik, ingatlah bahwa upaya yang Anda lakukan untuk membersihkan data dengan cermat dapat memberikan dampak signifikan pada hasil riset Anda. Kebersihan data bukan sekadar langkah teknis, tetapi merupakan fondasi utama yang mendukung keandalan dan validitas analisis Anda. Dengan berinvestasi waktu dan usaha dalam pembersihan data yang tepat, Anda akan mampu menghasilkan temuan yang lebih akurat dan menggambarkan gambaran yang lebih mendalam tentang dunia akademik.