Noskaņojuma analīze - Excel padomi

Satura rādītājs

Noskaņojuma analīze programmā Excel! Ir pieejams bezmaksas papildinājums no Microsoft Labs, kas ļaus jums veikt sentimenta analīzi programmā Excel. Ko darīt, ja jums ir jāšķērso simtiem aptaujas komentāru, lai redzētu, ko cilvēki domā par jūsu uzņēmumu? Excel var piešķirt varbūtību, kas parāda, cik pozitīvs vai negatīvs ir katrs komentārs.

Skatīties video

  • Aptaujas datus ir viegli kvantitatīvi noteikt, ja tiem ir vairākas izvēles iespējas
  • Varat izmantot rakurstabulu, lai noskaidrotu, cik procentuāli ir katra atbilde
  • Bet kā ar brīvas formas teksta atbildēm? Tos ir grūti apstrādāt, ja jums to ir simtiem vai tūkstošiem.
  • Sentimenta analīze ir mašīnveida metode, lai prognozētu, vai atbilde ir pozitīva vai negatīva.
  • Microsoft piedāvā rīku, kas veic sentimenta analīzi programmā Excel - Azure Machine Learning.
  • Tradicionālās noskaņas analīzei ir nepieciešams, lai cilvēks analizētu un kategorizētu 5% apgalvojumu.
  • Tradicionālā noskaņojuma analīze nav elastīga - vārdnīcu katrai nozarei atjaunosiet.
  • Excel izmanto MPQA subjektivitātes leksiku (lasiet par to vietnē http: // bit. Ly / 1SRNevt)
  • Šajā vispārīgajā vārdnīcā ir 5097 negatīvi un 2533 pozitīvi vārdi
  • Katram vārdam tiek piešķirta spēcīga vai vāja polaritāte
  • Tas lieliski darbojas īsos teikumos, piemēram, Tweets vai Facebook ierakstos
  • To var apmānīt ar dubultnegatīviem
  • Lai instalētu, dodieties uz Ievietot, Excel veikals, meklējiet Azure Machine Learning
  • Izvades diapazonam norādiet ievades diapazonu un divas tukšas kolonnas.
  • Ievades diapazona virsrakstam jāatbilst shēmai: tweet_text
  • Pavadošā raksta vietne: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/

Video atšifrējums

Uzziniet programmu Excel no Podcast, 2062. sērija: Sentimenta analīze programmā Excel

Ak, hei, tā bija Pateicības nakts, un mēs sēdējām ap ķirbju pīrāgu, un Jes, mūsu draugs, sāka runāt par sentimenta analīzi Twitter datos. Un es teicu: "Hei, jūs zināt, ka Excel ir veids, kā veikt sentimenta analīzi." Un es sapratu, ka man nav laba video par šo vai nevienu video, tāpēc šis video ir par sentimenta analīzi programmā Excel.

Tagad pirmais jautājums ir, kāda heck ir noskaņojuma analīze? Un, ja jūs veicat savu klientu aptauju un viņiem ir vairākas izvēles iespējas, kur viņi var izvēlēties no 1 līdz 5, tas ir ļoti, ļoti viegli analizēt. Varat vienkārši izveidot nelielu rakurstabulu: šeit ievietojiet rakurstabulu, Esošā darblapa, noklikšķiniet uz Labi. Mēs vēlamies uzzināt tur esošo jautājumu vai atbildi uz jautājumu un pēc tam, cik atbildes bija par katru no tiem, un tas dod mums absolūto skaitli. Jūs pat varat šeit ienākt un mainīt to no lauka iestatījumiem uz Rādīt vērtības kā% no kolonnas kopsummas, piemēram.

Labi, lai katrai atbildei redzētu, cik procentu cilvēku saņem atbildi. Labi, bet noskaņojuma analīze ir domāta, ja jums ir patiešām ilga atbilde, kur jūs sakāt: "Hei, labi, labi, jūs zināt, pastāstiet mums, kāpēc jūs mums atbildējāt?" Un viņi, jūs zināt, lieto teikumus vai rindkopas. Nu, ja jums to ir simtiem vai tūkstošiem, kādam ir ļoti grūti to iziet un izlasīt visus un saprast, kas notiek, labi?

Tātad ir divi dažādi noskaņojuma analīzes veidi. Parasti agrāk jūs izmantojāt cilvēka uzraudzītu mācību algoritmu. Tātad, ja jums bija 5000 atbilžu, pārbaudiet 200, un izvēlieties pozitīvos un negatīvos vārdus un frāzes. Jūs būtībā veidojat pozitīvo un negatīvo vārdu vārdnīcu; bet, jūs zināt, tas bija ļoti ierobežojoši. Ja jūs to darījāt vietā, kur veica automašīnu remontu un pēc tam bija cits klients, jūs zināt, kurš veica paklāju tīrīšanu, šīs divas vārdnīcas ir pilnīgi atšķirīgas. Mašīnmācība vai cilvēka vadīta mācīšanās ir jāveic vēl un vēl un vēl. Tātad, Excel izmanto šo lietu, ko sauc par MPQA subjektivitātes leksiku, un jūs varat to meklēt Google. Tajā ir informācija par to - 5 097 negatīvi vārdi, 2533 pozitīvi vārdi. Un tā,tas lieliski darbojas īsos teikumos vai Tweets vai Facebook ierakstos. Bet viena lieta, ko esmu pamanījis, ir tāda, ka, ja kāds raksta dubultnegatīvos, es nevaru teikt, ka es neienīstu šo funkciju, labi, mašīnmācīšanās tur neizdosies. Un heck, man neizdodas. Es nevaru pateikt, vai viņi ir laimīgi, vai nē.

Labi, tāpēc mēs rīkojamies šādi. Programmā Excel 2013 vai Excel 2016 dodieties uz cilni Ievietot, dodieties uz veikalu, kad parādās meklēšanas lodziņš, meklējiet Azure Machine un jūs tur iegūsit Azure Machine Learning. Mēs noklikšķinām uz Pievienot. Labi, un divi dažādi rīki šeit: Titanic Survivor Predictor, kas ir jautri; un teksta noskaņojuma analīzes Excel pievienojumprogramma. Izmantosim to vienu. Labi, šeit ir pāris lietas, kas jūs aizrauj. Jūsu virsraksts: Izņemiet rindkopu, lai paskaidrotu savu atbildi. Tam jāatbilst shēmai, un shēma saka, ka virsrakstā ir jāsaka tweet_text. Tātad, šeit augšā: tweet_text, protams, lietas, kurās ir reģistrjutīgas lietas, labi. Pēc tam aizveriet shēmu un pēc tam paredziet, Ievade: no A1 līdz 100, Maniem datiem ir galvenes, Izeja: DataB1, Iekļaujiet galvenes. Viņi mums iedos 2 kolonnas.Pārliecinieties, ka tur ir 2 tukšas kolonnas; pretējā gadījumā tas ignorēs datus. Jums ir 2 izvēles iespējas: dažas rindas vienlaikus vai kā partija. Tas ir tikai simts, tāpēc tam patiešām nav nozīmes. Es izvēlēšos Prognozēt un BAM! Tikai tik ātri.

Labi tagad, mēs iegūstam 2 kolonnas: mēs saņemam Sentiment un Score, labi. Tātad, attēlosim rādītājus šeit kā procentus ar ķekaru aiz komata. Labi, tātad 47,496, tas ir no 0 līdz 100%. Tuvu 100 ir ārkārtīgi pozitīvs, tuvu 0 ir ārkārtīgi negatīvs, labi? Tāpēc šeit mums ir tāda problēma, kurā ir neliela problēma, kas mani tracina. Nevar atrast risinājumu, tāpēc varat redzēt, kāpēc tas tiek vērtēts kā ārkārtīgi negatīvs. Apskatīsim vienu, kas ir ārkārtīgi pozitīvs. Labi, tāpēc jūs zināt, tāpēc mums šeit ir daži priecīgi vārdi: lūdzu un paldies, izsaukuma zīmes un tā tālāk. Tas varētu veicināt augsto rezultātu. Labi, vai tas ir ideāli? Nē, bet tas jums ļaus ātri un ātri pateikt, cik daudz cilvēku par šīm atbildēm ir ārkārtīgi priecīgi vai negatīvi.

And of course, again, here we can do this with a pivot table: Insert, Pivot Table, go to an Existing Worksheet right here, click OK, and we're interested in the Sentiment, and then maybe with the average Score is for each of those. So we'll change this under Field Settings to be an Average, click OK. And so, or maybe even a Count. I guess we'd want to know the Count, how many people. So we'll take some other field, and so, we know how many people were negative. Ooh, how many people were neutral, how many people were positive and what the average score of each of those was.

Alright, so if you have survey data and it's a multiple choice, easy to use a pivot table to figure out what percentage each answer has. But for free-form text answers, it's hard to process. If you have hundreds or thousands of them, sentiment analysis is a machine- based method for predicting if an answer is positive or negative. Microsoft offers a free tool for this. Works in Excel 2013 or Excel 2016, called Azure Machine Learning. Usually have to go through and categorize 5% of the statements manually by hand. It's not flexible, you have to re-categorize for each new data set, but Excel is using this MPQA Subjectivity Lexicon. It's a generic dictionary. It's going to work for short sentences, Tweets, Facebook posts. I can get fooled by double-negatives. So just go to the Excel Store, search for Azure Machine Learning. Specify an input and a two columns for an output range. Don't forget to change the heading to match the Schema, tweet_text, in this particular case.

Labi, tāpēc tur iet. Nākamreiz, kad jums būs daudz datu, ko analizēt, pārbaudiet, izmantojot Azure Machine Learning - bezmaksas pievienojumprogrammu Excel 2013. Paldies, ka apstājāties, nākamreiz redzēsim citu netcast apraidi no.

Lejupielādēt failu

Lejupielādējiet faila paraugu šeit: Podcast2062.xlsm

Interesanti raksti...