Analiza sentimentelor - Sfaturi Excel

Analiza sentimentelor în Excel! Există un supliment gratuit de la Microsoft Labs care vă va permite să efectuați analize de sentiment în Excel. Ce se întâmplă dacă trebuie să parcurgi sute de comentarii ale sondajului pentru a vedea ce cred oamenii despre compania ta? Excel poate atribui o probabilitate care arată cât de pozitiv sau negativ este fiecare comentariu.

Urmăriți videoclipul

  • Este ușor să cuantificați datele sondajului atunci când sunt cu alegere multiplă
  • Puteți utiliza un tabel pivot pentru a afla ce procentaj are fiecare răspuns
  • Dar cum rămâne cu răspunsurile text în formă liberă? Acestea sunt greu de procesat dacă aveți sute sau mii de ele.
  • Analiza sentimentelor este o metodă bazată pe mașini pentru a prezice dacă un răspuns este pozitiv sau negativ.
  • Microsoft oferă un instrument care face analiza sentimentelor în Excel - Azure Machine Learning.
  • Analiza tradițională a sentimentelor necesită ca un om să analizeze și să clasifice 5% din afirmații.
  • Analiza tradițională a sentimentelor nu este flexibilă - veți reconstrui dicționarul pentru fiecare industrie.
  • Excel folosește MPQA Subjectivity Lexicon (citiți despre asta la http: // bit. Ly / 1SRNevt)
  • Acest dicționar generic include 5.097 cuvinte negative și 2.533 cuvinte pozitive
  • Fiecărui cuvânt i se atribuie o polaritate puternică sau slabă
  • Acest lucru funcționează excelent pentru propoziții scurte, cum ar fi Tweets sau postări pe Facebook
  • Poate fi păcălit de dublu-negative
  • Pentru a instala, accesați Insert, Magazin Excel, căutați Azure Machine Learning
  • Specificați un interval de intrare și două coloane goale pentru intervalul de ieșire.
  • Titlul pentru intervalul de intrare trebuie să se potrivească schemei: tweet_text
  • Articol însoțitor la: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/

Transcriere video

Aflați Excel din Podcast, Episodul 2062: Analiza sentimentelor în Excel

O, hei, a fost o noapte de Ziua Recunoștinței și stăteam în jurul plăcintei cu dovleac și Jes, prietenul nostru, a început să vorbească despre analiza sentimentelor pe datele de pe Twitter. Și am spus: „Hei, știi că Excel are o modalitate de a face analize de sentiment”. Și mi-am dat seama că nu am un videoclip bun despre acesta sau vreun videoclip despre asta, așa că acest videoclip este despre analiza sentimentelor în Excel.

Acum, prima întrebare este, ce naiba este analiza sentimentelor? Și dacă faceți un sondaj al clienților dvs. și aceștia au o selecție cu opțiuni multiple în care pot alege de la 1 la 5, ei bine, este foarte ușor de analizat. Puteți crea doar un mic tabel pivot: Inserați tabelul pivot, Foaia de lucru existentă chiar aici, faceți clic pe OK. Vrem să știm întrebarea de acolo sau răspunsul la întrebare și apoi câte răspunsuri au existat pentru fiecare și asta ne dă numărul absolut. Puteți chiar să intrați aici și să schimbați acest lucru din Setări câmp pentru a afișa valorile ca% din totalul coloanei, așa.

Bine, astfel încât să puteți vedea pentru fiecare răspuns ce procent din oameni primesc un răspuns. Bine, dar analiza sentimentelor este pentru când ai un răspuns foarte lung în care spui: „Hei, bine, bine știi, spune-ne de ce ne-ai dat acel răspuns?” Și ei, știi, folosesc propoziții sau paragrafe. Ei bine, dacă aveți sute sau mii dintre acestea, este foarte greu pentru cineva să le parcurgă și să le citească pe toate și să-și dea seama ce se întâmplă, bine?

Deci, există două tipuri diferite de analiză a sentimentelor. De obicei, în trecut, ați folosi un algoritm de învățare supravegheat de către om. Deci, dacă ați avut 5.000 de răspunsuri, treceți, știți, 200 dintre acestea și alegeți cuvintele și frazele pozitive și negative. În esență, construiți un dicționar cu cuvinte pozitive și negative; dar, știi, a fost foarte limitativ. Dacă ați făcut acest lucru pentru un loc care a reparat mașina și apoi a avut un client diferit, știți, cine a făcut curățarea covoarelor, aceste două dicționare sunt complet diferite. Trebuie să faceți învățarea automată sau învățarea supravegheată de om de mai multe ori. Deci, Excel folosește acest lucru numit Lexicon de subiectivitate MPQA și puteți merge la Google. Are informații despre asta - 5.097 cuvinte negative, 2533 cuvinte pozitive. Așadar,funcționează excelent pentru propoziții scurte sau Tweets sau postări pe Facebook. Dar un lucru pe care l-am observat este că, dacă cineva scrie cu negative negative, nu pot spune că nu urăsc această caracteristică, învățarea automată va eșua acolo. Și naiba, nu reușesc. Nu pot să spun dacă sunt fericiți sau nu.

Bine, deci iată ce facem. În Excel 2013 sau Excel 2016, ieșiți la fila Inserare, accesați Magazin, când apare caseta de căutare căutați Azure Machine și obțineți Azure Machine Learning chiar acolo. Facem clic pe Adăugare. Bine, și două instrumente diferite aici: Titanic Survivor Predictor, care este distractiv; și, Suplimentul de analiză Text Sentiment pentru Excel. Să o folosim pe aceea. Bine, iată câteva lucruri care te vor împiedica. Antetul: Luați un paragraf pentru a explica răspunsul. Trebuie să se potrivească schemei, iar schema spune că titlul trebuie să spună tweet_text. Deci, aici: tweet_text, bineînțeles, contează majuscule și minuscule, bine. Și apoi închideți Schema, apoi Previzionați, Intrare: A1 până la 100, Datele mele au anteturi, Ieșire: DateB1, Includeți anteturile. Ne vor da 2 coloane.Asigurați-vă că aveți acolo 2 coloane goale; în caz contrar, va înlocui datele. Aveți 2 opțiuni: Câteva rânduri pe rând sau Ca lot. Aceasta este doar o sută, deci chiar nu contează. Voi alege Predict și BAM! Doar atât de repede.

Bine acum, avem 2 coloane: obținem un Sentiment și un Scor, bine. Deci, să reprezentăm scorurile aici ca procente cu o grămadă de zecimale. Bine, deci 47.496, acesta merge de la 0 la 100%. Aproape 100 este extrem de pozitiv, aproape 0 este extrem de negativ, bine? Deci, aici avem una în care există o problemă minoră, care mă înnebunește. Nu găsesc soluția, deci puteți vedea de ce este evaluat ca fiind extrem de negativ. Să ne uităm la unul care apare extrem de pozitiv. Bine, așa că știi, așa că avem câteva cuvinte fericite aici: vă rog și vă mulțumesc, puncte de exclamare și așa mai departe. Acest lucru ar putea contribui la scorul cel mai mare. Bine, deci este perfect? Nu, dar vă va oferi o modalitate rapidă și rapidă de a vă spune, știți, câți oameni sunt extrem de fericiți sau extrem de negativi cu privire la aceste răspunsuri.

And of course, again, here we can do this with a pivot table: Insert, Pivot Table, go to an Existing Worksheet right here, click OK, and we're interested in the Sentiment, and then maybe with the average Score is for each of those. So we'll change this under Field Settings to be an Average, click OK. And so, or maybe even a Count. I guess we'd want to know the Count, how many people. So we'll take some other field, and so, we know how many people were negative. Ooh, how many people were neutral, how many people were positive and what the average score of each of those was.

Alright, so if you have survey data and it's a multiple choice, easy to use a pivot table to figure out what percentage each answer has. But for free-form text answers, it's hard to process. If you have hundreds or thousands of them, sentiment analysis is a machine- based method for predicting if an answer is positive or negative. Microsoft offers a free tool for this. Works in Excel 2013 or Excel 2016, called Azure Machine Learning. Usually have to go through and categorize 5% of the statements manually by hand. It's not flexible, you have to re-categorize for each new data set, but Excel is using this MPQA Subjectivity Lexicon. It's a generic dictionary. It's going to work for short sentences, Tweets, Facebook posts. I can get fooled by double-negatives. So just go to the Excel Store, search for Azure Machine Learning. Specify an input and a two columns for an output range. Don't forget to change the heading to match the Schema, tweet_text, in this particular case.

Bine, așa că te duci. Data viitoare când aveți o cantitate mare de date de analizat, verificați folosind Azure Machine Learning, programul de completare gratuit pentru Excel 2013. Vă mulțumim că ați trecut pe aici, ne vom vedea data viitoare pentru un alt netcast de la.

Descărcare fișier

Descărcați exemplarul de fișier aici: Podcast2062.xlsm

Articole interesante...