CODE SHEESH
REF_03.2[ 2025 ]Gojek Sentiment Analysis
DATA SCIENCE MENTORSHIP
ID:03.2[ COMPLETED ]

Gojek Sentiment Analysis

Sesi 1-on-1 mentoring analisis sentimen terhadap 117.000 ulasan aplikasi Gojek dari Google Play Store — menghasilkan 27.938 entri bersih dan model LSTM dengan test accuracy 90.05%.

REF_03.2 · 2025

Work for

Personal Mentorship

Platform

Python / Google Colab

Year

2025

Segment

Mentorship

Deliverables

1-on-1 Mentorship & Sentiment Analysis Model

Technologies

PYTHONTENSORFLOWLSTMNLPSASTRAWIDATA SCIENCE
03.2
Mentorship

Overview

Sesi 1-on-1 sebagai Data Science Instructor — membimbing mentee membangun model analisis sentimen dari 117.000 ulasan Gojek di Google Play Store, menghasilkan 27.938 entri bersih setelah proses dropna dan drop_duplicates.

Pipeline preprocessing NLP dibangun penuh dari nol: cleaning, casefolding, slang fixing, tokenizing (NLTK), filtering stopwords (NLTK + custom), stemming (Sastrawi), dan joining — dilanjutkan dengan lexicon-based labeling menggunakan InSet Lexicon, menghasilkan 17.381 negatif, 8.452 positif, dan 2.105 netral.

Tiga model dibangun dan dievaluasi menggunakan TensorFlow/Keras: LSTM meraih test accuracy tertinggi 90.05% (train 95.39%), sementara CNN 88.87% (train 99.87%) dan RNN 87.54% (train 98.31%) menunjukkan gejala overfitting.