PS: Saya bukan pendukung capres 01 / 02 / 03 ataupun pemilih 01 / 02 / 03 untuk saat ini, artikel ini hanya murni analisa data yang ada.
Assalamualaikum warahmatullahi wabarakatuh, pada artikel kali ini saya mendapatkan data sebanyak 77,253 rows data ini didapatkan dari aktivitas Live Tiktok yang dilakukan oleh Bapak Anies Baswedan (Capres No 1) pada tanggal 4 Januari 2024 (04-01-2024) yang dimulai sekitar pukul 22:44:00 WIB asumsi ini dihitung karena saya join saat Bapak Anies sudah Live sekitar 6 menit dengan jumlah penonton sekitar 14.3 Ribu.
Lalu data apa saja yang berhasil saya dapatkan dari kegiatan Live yang dilakukan bapak Anies Baswedan ini? (userid,username,name,action [join, commenting, likes, gift], comment, profil_data[followingCount,followerCount,urlpict] data-data tersebut disimpan di Database MySQL yang ada di server local di rumah saya dan client scrapping juga ada di RDP rumah saya dengan teknologi NodeJS, kembali ke topik data berikut ini adalah susunan columns untuk menyimpan data
Data yang bisa disimpan sebenarnya banyak sekali, namun ada hal-hal yang belum sempat diidentifikasi dikarenakan saya ngodingnya di waktu yang berdekatan dengan Bapak Anies Live tiktoknya, tapi tak apa mari coba di analisa data-data yang ada.
Data yang ada di column action digunakan untuk menyimpan tiap-tiap event name yang terjadi selama Live yang ada, misalnya jika ada user yang Join ke Live tersebut maka event name yang disimpan adalah join
lalu jika ada user yang berkomentar pada live tersebut maka event name yang disimpan adalah chat
lalu jika ada user yang mengirimkan love maka event name yang disimpan adalah likes
3 event name di atas lah yang mendominasi Live bapak Anies tadi malam, juga ada event lain yang terjadi seperti gift yaitu saat orang mengirimkan digital assets ke Bapak Anies, berikut ini rincian yang ada
SELECT action, count(action) as total_action FROM live GROUP BY action ORDER BY total_action DESC
Dari data di atas, mayoritas data yang masuk ke Database saya adalah event komentar dari tiap-tiap user dengan jumlah 54,834 data diikuti dengan event bergabung dari user dengan jumlah 19,108 lalu ada juga yang melakukan event gifting sebanyak 4x, mungkin setelahnya dimatikan fitur tersebut oleh Bapak Anies, dari data-data action columns tersebut maka jika ditotal akan mendapatkan nilai yang sesuai dengan jumlah row awal yang ada 54834 + 19108 + 3306 + 4 + 1 = 77253
Tapi apakah 77253 data di atas adalah data yang unik? jawabannya adalah pastinya iya! Karena data scrapping di atas akan memiliki nilai yang unik dari Tiktok itu sendiri, setiap event yang terjadi di Live Tiktok akan memiliki nilai msgid
yang unik dan itu adalah data unik yang saya lakukan pengecekan selalau, berikut ini adalah buktinya.
Tidak ada msgid
yang lebih dari 1 dalam Database yang ada, menandakan semua event yang disimpan adalah unik.
Event name yang paling sedikit jumlahnya adalah startlive
dilihat dari namanya ini adalah waktu pertama kali Bapak Anies melakukan Livestreaming, berikut ini adalah datanya
Dari kolom tt_timestamp
adalah epoch format time, dan kolom datetime adalah hasil dari komputer milik saya. Jika dilakukan formating epoch ke human timestamp dengan menggunakan python3, 1704383068 adalah epoch yang dikembalikan nilainya oleh Tiktok Live
from datetime import datetime
epoch_time = 1704383068
formatted_date = datetime.utcfromtimestamp(epoch_time).strftime('%Y-%m-%d %H:%M:%S')
print(formatted_date)
'2024-01-04 15:44:28'
Format jam yang telah translasi menunjukan pada jam 15:44 atau jam sore, padahal aktualiasinya adalah pada pukul 22:44 sesuai dengan jam yang ada pada Laptop saya. Tapi yang pasti menit dan detiknya sudah didapatkan yaitu 22:44:28.
Event selanjutnya adalah gift
event ini terjadi saat ada seseorang mengirimkan hadiah digital yang dibeli dengan uang untuk Bapak Anies, event ini hanya menyimpan 4 record saja, mungkin fitur ini langsung dimatikan atau memang tidak sengaja untuk menyala, dari 4 record tersebut berikutlah rinciannya
Dari 4 record tersebut, sebenarnya hanya ada 2 user unik yang mengirimkan gift tersebut,
no | username |
---|---|
1 | arief.rahman72 |
2 | fatullah_garuda |
Keduanya sama-sama mengirimkan gift yang sama yaitu dengan detail seperti di bawah ini
5655|Rose|https://p19-webcast.tiktokcdn.com/img/maliva/webcast-va/eba3a9bb85c33e017f3648eaf88d7189~tplv-obj.png
key | explain |
---|---|
5655 | ID digital assets milik tiktok |
Rose | Nama assets digitalnya |
https://p19-webcast.tiktokcdn.com/img/maliva/webcast-va/eba3a9bb85c33e017f3648eaf88d7189~tplv-obj.png | Gambar assets yang dikirimkan |
Gambar di ataslah yang dikirimkan oleh user tersebut kepada Bapak Anies sewaktu Live, untuk harga tiap 1 mawar yang dikirimkan adalah bernilai 1 koin atau 250 rupiah, data ini dihitung dari artikel yang milik NarasiTV
**Nilai 250 perkoin dihitung dari Rp.1.250 (harga per 5koin) [1250/5]
Jadi selama Live, mungkin bapak Anies mendapatkan keuntungan sekitar 1000 rupiah dikarenakan mendapatkan Mawar 4x saya tidak tau dipotong pajak atau tidak, tapi lumayan untuk menambah dana kampanye, meskipun untuk beli Susu saja kurang.
Event likes ini saya sendiri sejujurnya Ragu dengan perhitungan dan data yang ada dalam database milik saya, karena scrapper-nya buggy untuk event likes ini, tapi tak apa mari coba dibeda.
Secara stuktur kolom yang saya buat, ada 2 kolom yang digunakan untuk menyimpan data dari event likes ini, pertama adalah totalliikes kolom ini datang dari Tiktok, isinya value Integer yang cukup besar (dalam artian lebih dari 1juta) maka asumsikan ini adalah Total Likes yang didapatkan dalam sesi Live ini, lalu ada lagi kolom sendlikes kolom ini berisi Value yang kecil dari Tiktok, maka dapat diasumsikan ini adalah jumlah likes yang coba dikirimkan per user.
Data totallikes yang didapatkan terakhir adalah 12796291 (12 Juta 7 Ratus) dengan msgid 7320285231247428357
dikarenakan saya melakukan scrapping sampai Bapak Anies selesai Live, maka dapat diasumsikan total Likes yang ada di Tiktok Bapak Anies adalah 12 Juta, hal ini saya tidak tau cara memvalidasinya, yang pasti pemegang akun Bapak Anies tau. Untuk sendlikes berikut datanya semua seragam mengirimkan 15 likes, tapi karena ini data yang dikembalikan tiktok, saya juga tidak dapat memvalidasinya
Hal yang dapat diekspolarasi adalah berapakah jumlah sendlikes terbanyak dari sebuah user yang dikirimkan pada live ini (meskipun tidak akurat).
Dari tabel di atas, top 3 dari kolom sendlikes adalah sebagai berikut ini
Username | Total_likes |
---|---|
muazleo2 | 310 |
saartjevankruijss | 288 |
muhmmadalfatih4 | 205 |
Dari tiap-tiap username tersebut di dalam database juga saya sebenarnya menyimpan juga nama,photo_profile, following, followers mari kita gunakan untuk Crosscheck, apakah memang akun ini adalah akun yang valid
** Data di dalam Database
Username | Name | Following | Followers | Status |
---|---|---|---|---|
muazleo2 | Muaz Leo | 154 | 151 | Valid |
saartjevankruijss | Sari Van Kruijssen 🇳🇱🇮🇩 | 1846 | 2246 | Valid |
muhmmadalfatih4 | muhammadalfatih٤٨٩ | 1750 | 1288 | Valid |
Dari ketiga top 3 pengirim Likes terbanyak tersebut, memiliki 1 kesamaan yaitu di salah satu post Tiktoknya pasti ada Highligh foto Bapak Anies, dan bisa dipastikan bahwa akun ini memang mendukung Bapak Anies. Tapi, dilihat dari pola postingannya bukanlah postingan seragam ala-ala buzzer, menurut saya Top 3 ini Organik pendukung pak Anies.
Event ini didapatkan saat ada sebuah akun user masuk ke dalam Live Tiktok yang dilakukan oleh Bapak Anies, ada 1 kolom yang menarik untuk dilakukan analisa pada event ini yaitu kolom followStatus
kolom ini digunakan untuk mendeteksi apakah user yang melakukan event sudah mem-follow akun Bapak Anies.
Dari query tersebut didapatkan bahwa ada 10ribu6ratus data username unique yang masuk ke Live Bapak Anies, bisa dikatakan Live ini FYP ke 10Ribu orang yang tidak memfollow Bapak Anies. Sedangkan yang sudah memfollow ada sebanyak 7925 user.
Hal yang menarik dianalisa adalah, apakah ada akun-akun besar yang join Live Bapak Anies ini, saya melakukan sorting melalui followerCount yang ada dan berikut ini hasilnya
Followers terbanyak yang join Live Bapak Anies adalah sebanyak 1506114 (1.5) juta oleh depuncraft
mari coba dibedah 1 per 1 apakh benar memang followersnya seperti apa yang di Database?
** Data di dalam Database
Username | Followers | Follow Status | Status |
---|---|---|---|
depuncraft | 1506114 | 1 | Valid |
yoo_tooo | 1465336 | 0 | Valid (follower naik) |
koki.geprek | 1248389 | 0 | Valid |
mynameismail_ | 791335 | 0 | Uncheck |
dipidiyini | 506323 | 0 | Uncheck |
ilazahara | 436667 | 1 | Valid |
syekharpi | 401213 | 0 | Uncheck |
widbatik.id | 381079 | 0 | Uncheck |
harimaumedan | 335952 | 1 | Uncheck |
poponcitra | 335197 | 1 | Uncheck |
Akun-akun besar tersebut memang ada dan memang sudah memfollow Bapak Anies di Tiktok, ada juga yang datanya tidak sama dengan Database yaitu dikarenakan Followersnya sudah naik.
Event commenting ini sangat banyak sekali, saya mendapatkan sebanyak 54834 (54Ribu8Ratus) komentar, dari berbagai komentar tersebut pastinya banyak sekali komentar positif dan harusnya juga komentar negatif tapi mari kita ranting top 10 penyumbang komentar terbanyak pada sesi Live Bapak Anies kali ini
Username | Total Comment |
---|---|
nafigomprong0 | 120 |
uu14081980 | 113 |
aggilico12 | 110 |
icyyu | 110 |
zalika.atau.ika | 109 |
kamilake.lake | 106 |
dnxx468 | 102 |
shen_hu_shen | 90 |
rinki1357 | 88 |
harisalexis5 | 86 |
Terlihat dari data yang saya miliki, 1 users paling banyak mengirimkan komentar 120 kali, dan top 10 semuanya mengirimkan komentar di atas 50 kali semua, cukup banyak dan apakah ini spam? mari kita lihat datanya.
Dari top 3 komentar yang saya check, hanya komen top 1 yang tidak mengindikasikan seperti penonton yang mau menonton live Bapak Anies, dikarenakan komennya hanya spamming sebanyak 120 berupa angka (2), yang mana dalam konteks capres adalah pasangan Bapak Prabowo & Mas Gibran dan juga dilihat dari akun top 1 https://www.tiktok.com/@nafigomprong0 terlihat bahwa memang pendukung dari Bapak Prabowo
Menarik, setelah melihat top komen adalah pendukung capres yang bukan Bapak Anies, menarik untuk mencari komentar-komentar lain yang berkaitan dengan capres yang lain, berikut hasilnya
prabowo
ganjar
mahfud
gibran
imin
jokowi
presiden
Ada 2 nama penting dalam putaran capres yang tidak sebut, pertama ada Bapak Ganjar dan Mas Gibran yang sama sekali tidak pernah tersebut dalam live Bapak Anies, menarik. Sekarang mari analisa kata-kata yang sering muncul dalam live Bapak Anies ini
Dengan melakukan select ke seluruh komentar yang ada, saya mendapatkan banyak sekali junk komen seperti data di atas, banyak kata-kata yang harusnya di hapuskan seperti “join,likes,saya,gimana’ dan seterusnya maka dari itu saya akan membuat regex sederhana untuk melakukan remove kata-kata tersebut.
def clean(text, words_to_remove):
pattern = '|'.join(re.escape(word) for word in words_to_remove)
regex = re.compile(r'\b(?:' + pattern + r')\b', flags=re.IGNORECASE)
cleaned_text = regex.sub('', text)
return cleaned_text
words_to_remove = ["join", "likes", "amin", "saya", "gimana"]
Dan hasilnya cukup memuaskan, berikut ini lah hasilnya jika sudah sedikit dibersihkan
Kata yang paling besar adalah “salam” dan “kapan” yang mana jika diasumsikan maka pertanyaannya banyak berpola seperti “Kapan ke xxxx”, “Salam dari xxxx” seperti itulah kebanyakan. Juga dari kata-kata di atas jika dilakukan sorting ada banyak ‘doain’ dan ‘abah’ banyak yang meminta didoakan oleh Bapak Anies atas apa yang user akan lakukan
Semoga semuanya diberikan kelancaran!
Tech Stack
Terima kasih teman-teman sudah membaca mohon maaf jika ada bagian tulisan ini yang tidak nyaman di hati dan juga seharusnya lebih banyak hal yang bisa dieksplorasi dari data sebesar ini, namun karena keterbatasan skill yang saya miliki dalam mengola sebuah data. Hal-hal lain yang bisa dieksplorasi mungkin sebuah sentimen analisis, komentar positif ataupun negatif atau hal-hal lainnya juga yang saya belum bisa lakukan, semoga teman-teman bisa eksplorasi lebih.
Saya bukan pendukung capres 01 / 02 / 03 bahkan belum menentukan pilihan juga, yang saya lakukan ini adalah murni untuk tetap belajar mengolah data dan belajar melakukan scrapping, agar kemampuan programming saya tidak luntur.
Kode yang saya gunakan ini belum dapat dibagikan, alasannya karena jelek saja.
Seluruh data yang saya dapatkan ini berasal dari Live Bapak Anies Baswedan dan semuanya dapat dipertanggungjawabkan keabsahannya. Juga teman-teman penggiat data dapat melakukan olah data juga dari data yang saya miliki ini, silahkan PM (Private Message) untuk mendapatkan aksesnya .sql