Психологија

Курс:
Одабране теме из психолингвистике и квантитативне лингвистике
Предавачи: др Душица Филиповић Ђурђевићванредни професор
изборни курс
Број бодова: 10.00
Садржај курса: На курсу ће, на напредном нивоу бити обрађиване кључне теме релевантне за квантитативни и пробабилистички приступ језику. Студенти ће бити упознати са основним теоријским појмовима и основним алатима којима се истраживачи у овој области служе. То подразумева бављење појмовима из области лингвистике, психологије, математике (нарочито теорије вероватноће), теорије информације, рачунарства, вештачке интелигенције, статистике. Нарочити нагласак биће стављен на детаљно практично бављење напредним техникама статистичке анализе, као што је анализа мешовитих ефеката (у својим различитим варијантама). Проучаваћемо на који начин се различити нивои језика могу квантитативно описати.
Циљ изучавања курса: Циљ је да студент разуме значај и моћ примене квантитативних техника у испитивању језика, као и да стекне одговарајуће вештине њихове примене и одговарајуће теоријско знање како би био кадар да препозна поља њихове примене.
Предуслови за полагање: Положена Психолингвистика или еквивалентно знање. Пожељно је и поседовање знања из когнитивне психологије, методологије псих. истраживања и статистике, као и основно познавање граматичких описа језика
Облици наставе: Предавања, демонстрације, интерактивна настава, учешће у дискусијама, самостални рад у виду израде пројеката – домаћих задатака и завршног рада, консултације.
План курса:

1. недеља
предавање - Договори о раду, увод у дискусију о пробабилистичкој природи језика
Упознавање са начином и динамиком рада, као и обавезама на курсу. Излагање о два погледа на језик и њихово смештање у контекст филозофских праваца (рационалистичко насупрот емпиристичком), излагање аргумената у прилог једном и другом, отварање дискусије, смештање квантитативног приступа у контекст ова два погледа на језик.

2. недеља
предавање - Језички корпуси
Упознавање са појмом језичког корпуса и великих електронских база текста, могућностима њихове експлоатације, различитим врстама корпуса, као и основним принципима њихове израде. Демонстрација основних закона формулисаних квантитативном анализом електроонских база. Истраживање одабраних примера постојећих корпуса енглеског и српског језика.

3. недеља
предавање - Основни појмови теорије вероватноће
Излагање о основним појмовима и принципима теорије вероватноће (вероватноћа, условна вероватноћа, здружена вероватноћа, зависни и независни догађаји, Бејзова формула итд). Поређење фреквенцијског и бејзијанског приступа.

4. недеља
предавање - Основни појмови теорије информације
Излагање о основним појмовима теорије информације (количина информације, ентропија, редунданса, максимална ентропија, условна ентропија, здружена ентропија, релативна ентропија, кросентропија, заједничка информација итд). Илустрација примене мера изведених из теорије информације преко примера из досадашњих истраживања језика.

5. недеља
предавање - Квантитативни опис на нивоу фонологије
Приказ одабраних истраживања у којима је квантитативни опис примењен на област фонологије (нпр. фонотактичке вероватноће, фонолошко суседство, ортографско суседство итд). Нагласак на истраживањима у којима су мере изведене из теорије информације примењене на фонолошке аспекте продукције и перцепције говора.

6. недеља
предавање - Квантитативни опис на нивоу морфологије и синтаксе
Приказ одабраних истраживања у којима је квантитативни опис, са нагласком на информационо-теоријске мере примењен на област морфологије и синтаксе (нпр. величина морфолошке фамилије, деривациона продуктивност, флективна ентропија, релативна ентропија, синтаксичка ентропија итд).

7. недеља
предавање - Квантитативни опис на нивоу семантике
Излагање о основним принципима дистрибуционе семантике и различитим варијантама њене реализације. Демонстрација ауторског софтвера за формирање семантичких вектора, поређење различитих врста контекстуалних вектора. Поређење фреквенцијских и предвиђачких модела дистрибуционе семантике. Контекстуална дистинктивност, семантички диверзитет.

8. недеља
предавање - Рад у R окружењу, основе
Упознавање и практични рад са основама рада у статистичком програму R (оператори, функције, рад са фајловима, R верзије основних статистичких техника као што су генерални линеарни модели, кластер анализа, анализа главних компоненти и сл).

9. недеља
предавање - Рад у R окружењу, графички приказ података
Упознавање и практични рад са различитим могућностима графичког приказа података које пружа окружење статистичког програма R (које пружају пакети као што су ggplot, lattice). Рад са графиконима који се састоје из слојева, различити начини обележавања података на графикону.

10. недеља
предавање - Рад у R окружењу, анализа мешовитих ефеката
Упознавање и практични рад са тренутно доминантним приступом у анализи психолингвистичких података – анализом мешовитих ефеката, R у окружењу. Рад са категоријалним и континуираним предикторима, тестрање колинеарности, дијагностика, тестирање фиксних и случајних ефеката, као и интеракција фиксних и случајних ефеката.

11. недеља
предавање - Основе програмирања у програмском језику Python
Упознавање и практични рад са основама програмирања у програмском језику Python (типови података, оператори, функције, итерација, кондиционали, петље, стрингови, листе, таплови, рад са фајловима, итд).

12. недеља
предавање - Одабране теме, практична примена
Демонстрација примера који су одабрани у договору са полазницима и у складу са њиховим интересовањима. Студентске презентације.

13. недеља
предавање - Завршне консултације у вези са истраживачким пројектима
Час посвећен излагању нацрта за завршни рад полазника. Заједничка дискусија.
Литература и извори података:
Општа обавезна литература
Baayen, R. H. (2008). Analyzing Linguistic Data. Cambridge: Cambridge University Press. Chang, W. (2018). R Graphics Cookbook: Practical Recipes for Visualizing Data. O'Reilly Media. http://www.cookbook-r.com/
Chang, W. (2018). R Graphics Cookbook: Practical Recipes for Visualizing Data. O’Reilly Media. http://www.cookbook-r.com/
Downey, A. B. (2012). Think Python: How to Think Like a Computer Scientist. Green Tea Press. http://greenteapress.com/wp/think-python/
Jurafsky, D. and Martin, J. H. (2000). Speech and Language Processing. New Jersey: Prentice Hall.
MacKay, D.J.C. (2003). Information Theory, Inference, and Learning Algorithms. Cambridge, UK: Cambridge University Press.
Manning, C. D. and Schuetze, H. (2000). Foundations of Statistical Natural Language Processing. Cambridge: The MIT Press.
Weisser. M. (2016). Practical Corpus Linguistics: An Introduction To Corpus-Based Language Analysis. Wiley.
Општа допунска литература
Bird, S., Klein, E., & Loper, E. (2009). Natural Language Processing with Python. O’Reilly Press.
Chakrabarti, S. (2003). Mining the Web. Elsevier. https://www.cse.iitb.ac.in/~soumen/mining-the-web/
Cover, T. M., & Thomas, J. A. (1991). Elements of information theory. New York: John Wiley & Sons.
Gaskell, M. G. (2007). The Oxford Handbook of Psycholinguistics. Oxford: Oxford University Press.
Harley, T. A. (2008). The Psychology of Language: From data to theory (3rd. ed.). Hove: Psychology Press.
Traxler, M., J., & Gernsbacher, M., A. (2006). Handbook of Psycholinguistics (Second Edition). New York: Academic Press.
Whitney, P. (1997). The Psychology of Language. Boston: Houghton Mifflin.
Wickham, H. (2016). ggplot2: Elegant graphics for data analysis. Springer.
Wynne, M. (ed.). (2005). Developing Linguistic Corpora: A Guide to Good Practice. Oxbow Books. http://ota.ox.ac.uk/documents/creating/dlc/
↑↑↑