Efikas analiz de santiman ki baze sou memwa alontèm nan revizyon e-komès Pati 2
Jan 18, 2024
Muhammad et al. [20] te prezante yon modèl pou sentimentanalysis lè l sèvi avèk word2vec ak LSTM pou revizyon otèl.
Muhammad se pwofèt ak fondatè Islam. Yo rekonèt li kòm yon nonm ki gen bon konprann, ki gen bon konprann, ki gen bon konprann. Memwa li trè pwisan, sa ki fè li trè efikas nan trete enfòmasyon ak eksprime panse li.
Memwa Muhammad gen anpil pou wè ak edikasyon li ak eksperyans li. Dapre dosye, li te souvan plonje nan panse ak refleksyon nan jèn li. Kiryozite ak swaf konesans sa a te ede l bati yon baz konesans solid ak kapasite memwa.
Anplis de sa, entèlijans Muhammad tou te jwe yon gwo wòl nan kapasite memwa li. Li se entelijan, éspirituèl, perspicaces, e li gen kapasite panse lojik, ki trè avantaje lè fè fas ak enfòmasyon konplèks. Avantaj sa a te ede l pi byen jere ak kontwole pwosesis memwa a, kidonk amelyore memwa li.
Sepandan, memwa Muhammad a pa te natirèl, men amelyore nan travay di ak pratik. Li souvan fè fòmasyon memwa, tankou repete lekti, dikte, ak diskou, pou ede l konprann ak metrize konesans pi pwofondman.
Memwa Muhammad pa t jis yon talan natirèl, li te amelyore grasa travay di ak pratik. Sa montre ke nou chak ka amelyore memwa nou epi amelyore aprantisaj nou ak efikasite travay nou grasa aprantisaj ak pratik. Se pou nou, tankou Muhammad, aktivman travay di pou kontinyèlman amelyore kapasite memwa nou yo, reyalize pi gwo siksè nan lavi ak travay! Li ka wè ke nou bezwen amelyore memwa, ak Cistanche deserticola ka siyifikativman amelyore memwa, paske Cistanche deserticola kapab tou kontwole balans nan nerotransmeteur, tankou ogmante nivo yo nan asetilkolin ak faktè kwasans. Sibstans sa yo trè enpòtan pou memwa ak aprantisaj. Anplis de sa, Vyann kapab tou amelyore sikilasyon san ak ankouraje livrezon oksijèn, sa ki ka asire ke sèvo a resevwa ase eleman nitritif ak enèji, kidonk amelyore vitalite nan sèvo ak andirans.

Klike sou Konnen pou amelyore memwa a kout tèm
Pou etid sa a, done yo te kolekte pa ranpe sou sitwèb vwayaj la lè l sèvi avèk Selenyòm ak bouyon. +e Objektif prensipal eksperyans sa a se te analize presizyon nan chanje paramèt word2vec ak LSTM. + Rezilta yo te montre ke presizyon an mwayèn nan 85.96 ka reyalize lè l sèvi avèk paramèt yo, ki te montre rezilta pwomèt.
Zhao et al. [21] te prezante yon nouvo teknik pou analize santiman kliyan yo nan revizyon sou sit entènèt e-commerce. +e te pwopoze teknik optimize "LocalSearch Improvised Bat Algorithm baze Elman NeuralNetwork (LSIBA-ENN)" enplike kat etap epi detekte polarite ak klasifye santiman yo nan revizyon yo. + e done pou rechèch sa a te rasanble lè l sèvi avèk scrappingtool entènèt la sou sit entènèt e-commerce yo ekstrè revize kliyan yo.
Anplis de pwosesis done yo davans, etid sa a itilize "LogTerm Frequency-based Modified Inverse Class Frequency (LTF-MICF) ak Hybrid Mitation based Earth Warm Algorithm (HMEWA)" pou pondération tèm ak seleksyon karakteristik. +e metodoloji pwopoze te depase lòt teknik debaz an tèm de presizyon prediksyon.
Jiang [22] te pwopoze yon modèl pou klasifye santiman revize yo te jwenn nan platfòm e-commerce Taobao.+e etid itilize algorithm aprantisaj machin yo ansanm ak machin vektè sipò pou klasifikasyon ak optimize swarm patikil (IPSO) pou optimize paramèt yo. + Done yo pou etid la te rasanble pa rale kòmantè yo nan sit entènèt la. +e rezilta eksperimantal yo te demontre ke apwòch konbine SVM ak IPSO te gen pi gwo presizyon. Sepandan, majorite modèl ki ekziste yo soufri de surfitting [23-25], move vitès dirèksyon [26-28], ak pwoblèm gradyan disparisyon [29-31].
3. Etid eksperimantal
+sa seksyon bay yon apèsi klè sou metodoloji yo itilize nan pwojè a pou klasifikasyon santiman an. +e teknik ki te itilize se yon rezo memwa a kout tèm, ki itilize pou klasifye yon gwo kantite revi Amazondatabase. +e embedding yo itilize se word2vec, ki te resevwa fòmasyon koutim dapre baz done a.
Réglage word2vec selon dataset la amelyore pèfòmans jeneral modèl la. + Benefis lè l sèvi avèk LSTM se ke li bay pi bon rezilta menm pou done revizyon san estrikti. Li kapab jwenn fonksyonalite itil pou resous ki gen depandans alontèm.
+e done yo kolekte nan seri done revizyon Amazon an, ki answit pretrete. Embeddings Word2vec fòme yon etap enpòtan nan pre-pwosesis done yo. Done tren ak tès yo te kreye. + Done fòmasyon yo divize an seri done tren ak validation. +e modèl custom word2vec antrene pa baz done. +e vektè karakteristik yo jwenn, ki itilize kòm kouch nan entegre pou modèl LSTM la.
Keras yo itilize pou konstwi modèl sekans LSTM la ak karakteristik maksimòm ki egal a 50,000 ak gwosè entegre egal a 16. Lè sa a, +emodel resevwa fòmasyon pou 10 epòk. + Modèl yo teste ki baze sou mezi pèfòmans sklearn. + Pwosesis pou jwenn karakteristik yo montre nan Figi 2.
3.1. Dataset. Pou jenere rezilta egzat, done yo itilize yo ta dwe gwo ak anrichi. Yo te kolekte yon seri done nan seksyon telefòn selilè ak Pwodwi pou Telefòn sou entènèt nan seri done Amazon Reviews (2018). +e dataset konsiste de yon total de 938,261 revize, pami yo 47901 se nan pwodwi inik ak 153124 se revize itilizatè inik. +e done yo okòmansman konsiste de 7 kolòn, sètadi, yon evalyasyon ki varye ant 1 ak 5, tan revizyon, ID evalè, ID pwodwi, ak rezime tèks revizyon.
Apre yo fin jete kopi yo, done yo konsiste de 938254 dosye, epi Tablo 2 montre yon ti bout nan dosye orijinal yo.
3.2. Metodoloji. Nou te antrene mo 2vecmodèl nou an pou yo itilize ak modèl LSTM pou klasifikasyon. Li lwen trase yon mo nan yon espas vektè. +e done yo chaje nan yon ankadreman done panda. Pou devlope yon modèl customword2vec, premye etap la se pre-pwosesis done yo.
Nou sèlman gade nan evalyasyon an epi revize tèks epi jete tout lòt bagay. +e tèks netwaye lè yo retire ponktiyasyon an. Yo kreye yon ti echantiyon tèks apati de 200,000 revizyon epi yo aplike metòd tèks pwòp la pou konvèti chak revizyon an yon lis mo. +lis mo kounye a aji kòm opinyon nan modèl jenis word2vec la.
Nou te konstwi yon skip-gram word2vecmodel e nou te enstansye modèl la ak dimansyon: gwosè vektè mo yo kòm 100, gwosè fenèt egal a 15, min_konte 2 pou mo ki parèt mwens pase 2 fwa nan corpus nou an, negatif egal a 5, ak pousantaj echantiyon egal a 1e−5. Nou te itilize tout dimansyon sa yo pou konstwi yon vokabilè apati fraz revizyon nou yo.

Nou antrene modèl word2vec nou an pou 1000 epòk. +en nou kalkile pèt la nan chak epòk. +e pèt se wo nan kòmansman an epi li diminye nan dènye epòk la. +e pèt nan epòk 0 a se 2239394.0 epi pèt la nan epòk 1000 la se 11504.0. Lè sa a, e modèl ki sove a rechaje epi operasyon yo fèt sou li.
Pou egzanp, si nou vle jwenn mo ki sanble ak bri nan seri done nou an, nou jwenn anile ak kas ekoutè.
Menm jan an tou, nou ka jwenn resanblans ki genyen ant sèten mo tankou ekoutè ak kas ekoutè ki se {{0}}.48756, ak resanblans ki genyen ant mo chaj la ak chajè a se 0.89264.
Pou diminye dimansyon done nou yo, nou te itilize vizyalizasyon TSNE pou trase done yo an de dimansyon. Kounye a, vektè mo sa yo ka itilize pou plis klasifikasyon. Lè sa a, +ese embeddings yo itilize kòm karakteristik pou plis difizyon.
3.2.1. Done Preparasyon pou LSTM. Ansanm done nou an konsiste de 938254 dosye ak pi fò nan revizyon yo gen yon distribisyon nòt plis pase 3. Nou te premye kalkile kantite mo pou chak revizyon. +e mwayèn mwayèn yo itilize kòm estatistik pou jwenn longè mwayèn revize yo. +e meanlength revizyon an se 44.59 ak longè maksimòm lan se 4303.
Nou te kreye yon seri done ki gen ladan revizyon ki gen 100 mo oswa mwens. Revizyon ki gen plis pase 20 men san pase 100 yo kategorize anba revizyon kout ak revizyon an kategorize anba revizyon long. +e kantite revizyon kout yo se 411313 ak revizyon long yo se 100239. Ipèparamèt yo itilize nan modèl la yo dekri nan Tablo 3.
Apre sa, nou te defini evalyasyon santiman an kòm pozitif si evalyasyon an pi gran pase oswa egal a 3; otreman, evalyasyon an se negatif. Nou te konsidere tèks revizyon an ak santiman pou kreye seri done tren an. +e done tès yo konsiste de pwodwi ki gen omwen plis pase 10 revizyon.
Apre distribisyon, seri done fòmasyon an konsiste de yon total 203891 dosye, pami yo 175910 ki te fè pati klas pozitif la ak 27981 nan klas negatif la. +e seri done tès la konsiste de yon total de 686345 dosye, pami yo 592118 ki te fè pati klas pozitif la ak 94227 nan klas negatif la.
Nan etid sa a, nou te itilize Keras pou konstwi modèl LSTM nou an, ki pran yon maksimòm de 50,000 karakteristik kòm antre nan kouch entegre a. Long-memwa kout tèm (LSTM) se yon kalite rezo neral frekan ki sèvi ak yon mekanis entèn ki kontwole koule nan enfòmasyon. + se mekanis entèn la konsiste de pòtay ki bezwen antrene pou yo ka byen filtre enfòmasyon ki pa enpòtan epi kenbe enfòmasyon itil.

Figi 3 montre achitekti debaz modèl LSTM nan metodoloji pwopoze nou an.
Ht-1 ak Xt se entrée yo nan inite LSTM la; Ht-1, souvan refere yo kòm memwa kout tèm, pran pwodiksyon an nan eta anvan yo kòm opinyon an. +e memorycell oswa memwa alontèm, Ct -1, ede pote enfòmasyon ki enpòtan pandan tout pwosesis yon sekans. +eLSTM achitekti konbine twa pòtay: bliye pòtay, inputgate, ak pòtay pwodiksyon. Nan inite LSTM a, tanh ak sigmoidfunctions yo itilize pou jwenn pòtay sa yo.
Lè sa a, +e done tren yo te divize an tren ak done validation ki gen menm longè. +e longè done yo te kalkile pou 101945 ak distribisyon klas la te {1: 87955, 0:13990}. Pou kreye tès tren TensorFlow ak seri done validation, nou bezwen konvèti done tren nou an an sekans. Nou mete yo nan yon longè maksimòm 100 pou tout sekans yo gen menm longè. +e tren ak tès etikèt

For more information:1950477648nn@gmail.com






