Jump to content

Semantic Scholar

Վիքիպեդիայից՝ ազատ հանրագիտարանից
Semantic Scholar
Տեսակկայք, RSS-ագրեգատոր և գիտելիքների գրաֆիկ
Երկիր ԱՄՆ
ՀիմնադիրՕրեն Էցիոնի
Կայքsemanticscholar.org(անգլ.)

Semantic Scholar, գիտական գրականության հետազոտական գործիք: Այն մշակել են Ալլենի արհեստական բանականության ինստիտուտում և հրապարակայնորեն թողարկվել է 2015 թվականի նոյեմբերին[1]: Semantic Scholar-ը օգտագործում է բնական լեզվի մշակման ժամանակակից տեխնիկաներ՝ հետազոտական գործընթացը աջակցելու համար, օրինակ՝ տրամադրելով գիտական հոդվածների ավտոմատ կերպով ստեղծված ամփոփագրեր[2]: Semantic Scholar թիմը ակտիվորեն հետազոտում է արհեստական բանականության օգտագործումը բնական լեզվի մշակման, մեքենայական ուսուցման, մարդ-համակարգիչ փոխազդեցության և տեղեկատվության որոնման մեջ[3]:

Semantic Scholar-ը սկզբնապես ստեղծվել է որպես համակարգչային գիտության, երկրաբանության և նյարդաբանության թեմաների տվյալների բազա[4]։ 2017 թվականին համակարգը սկսել է իր ��որպուսում ներառել կենսաբժշկական գրականությու[4]ն։ Այն ներառում է գիտության բոլոր ոլորտներից ավելի քան 200 միլիոն հրապարակումներ[5]։

Semantic Scholar-ը ներկայացնում է գիտական գրականության մեկ նախադասությունից բաղկացած ամփոփում: Դրա նպատակներից մեկը բազմաթիվ վերնագրերի և երկար աբստրակտների բջջային սարքերով ընթերցման մարտահրավերի լուծումն էր[6]: Այն նաև ձգտում է ապահովել, որ տարեկան հրատարակվող երեք միլիոն գիտական հոդվածները հասնեն ընթերցողներին, քանի որ ըստ գնահատման այս գրականության միայն կեսն է երբևէ կարդացվում[7]:

Արհեստական բանականությունն օգտագործվում է հոդվածի էությունը ընկալելու համար՝ այն ստեղծելով «աբստրակտ» տեխնիկայի միջոցով[8]։ Նախագիծը օգտագործում է մեքենայական ուսուցման, բնական լեզվի մշակման և մեքենայական տեսողության համադրություն՝ մեջբերումների վերլուծության ավանդական մեթոդներին իմաստային վերլուծության շերտ ավելացնելու և հոդվածներից համապատասխան նկարներ, աղյուսակներ, միավորներ և վայրեր արդյունահանելու համար[9][10]։

Research Feeds-ի մեկ այլ կարևոր գործառույթ է ադապտիվ հետազոտությունների խորհուրդ տվող գործիքը, որն աշխատում է արհեստական բանականության միջոցով՝ արագորեն իմանալու համար, թե որ հոդվածներն են օգտատերերին հետաքրքրում կարդալ, և խորհուրդ է տալիս ամենավերջին հետազոտո��թյունները՝ գիտնականներին օգնելու մնալ տեղեկացված։ Այն օգտագործում է համեմատական ուսուցման միջոցով մարզված հոդվածների ներդրման ժամանակակից մոդել՝ յուրաքանչյուր գրադարանի թղթապանակում առկա հոդվածներին նման հոդվածներ գտնելու համար[11]։

Semantic Scholar-ը նաև առաջարկում է Semantic Reader-ը՝ լրացված ընթերցիչ, որն ունի գիտական ընթերցանությունը հեղափոխելու ներուժ՝ այն դարձնելով ավելի մատչելի և հարուստ համատեքստային[12]։ Semantic Reader-ը տրամադրում է հղումների քարտեր, որոնք թույլ են տալիս օգտատերերին տեսնել հղումները TLDR-ի միջոցով (կարճ՝ Too Long, Didn't Read), որը ավտոմատ կերպով ստեղծում է կարճ ամփոփումներ՝ կարդալիս, և թերթում է կարևորագույն կետերը, որոնք արտացոլում են հոդվածի հիմնական կետերը, որպեսզի օգտատերերը կարողանան ավելի արագ ընկալել նյութը։

Ի տարբերություն Google Scholar-ի և PubMed-ի, Semantic Scholar-ը նախատեսված է հոդվածի ամենակարևոր և ազդեցիկ տարրերը ընդգծելու համար[13]: Արհեստական բանականության տեխնոլոգիան նախատեսված է հետազոտական թեմաների միջև թաքնված կապերը բացահայտելու համար[14]: Նախկինում մեջբերված որոնողական համակարգերի նման, Semantic Scholar-ը նույնպես օգտագործում է գրաֆիկական կառուցվածքներ, որոնք ներառում են Microsoft Academic Knowledge Graph-ը, Springer Nature-ի SciGraph-ը և Semantic Scholar Corpus-ը (սկզբնապես 45 միլիոն հոդվածների կորպուս՝ համակարգչային գիտության, նյարդաբանության և կենսաբժշկության ոլորտներում)[15][16]։

Հոդվածի նույնականացուցիչ և ինդեքսավորում

[խմբագրել | խմբագրել կոդը]

Semantic Scholar-ի կողմից հյուրընկալվող յուրաքանչյուր հոդվածին տրվում է եզակի նույնականացուցիչ, որը կոչվում է Semantic Scholar Corpus ID (կրճատ՝ S2CID): Semantic Scholar-ը անվճար է օգտագործման համար և, ի տարբերություն նմանատիպ որոնողական համակարգերի[17]։ Մի ուսումնասիրություն համեմատել է Semantic Scholar-ի ինդեքսների շրջանակը Google Scholar-ի հետ և պարզել, որ համակարգչային գիտության երկրորդական ուսումնասիրությունների կողմից մեջբերված հոդվածների համար երկու ինդեքսներն էլ ունեցել են համեմատելի ծածկույթ, որոնցից յուրաքանչյուրում բացակայում է միայն մի քանի հոդված[18]։

Օգտատերերի և հրապարակումների քանակ

[խմբագրել | խմբագրել կոդը]

2018 թվականի հունվարի դրությամբ, 2017 թվականի նախագծից հետո, որը ներառել է կենսաբժշկական հոդվածներ և թեմաների ամփոփումներ, Semantic Scholar-ի կորպուսը ներառել է ավելի քան 40 միլիոն հոդված համակարգչային գիտության և կենսաբժշկության ոլորտներից[19]։ 2018 թվականի մարտին Դուգ Ռեյմոնդը, որը մշակել էր մեքենայական ուսուցման նախաձեռնություններ Amazon Alexa հարթակի համար, վարձվել է ղեկավարելու Semantic Scholar նախագիծը[20]։ Ներառված հոդվածների մետատվյալների քանակը (ոչ թե իրական PDF ֆայլերը) աճել են՝ հասնելով ավելի քան 173 միլիոնի[21] Microsoft Academic Graph գրառումների ավելացումից հետո[22]։ 2020 թվականին Semantic Scholar-ի և Չիկագոյի համալսարանի հրատարակչական ամսագրերի միջև համագործակցության շնորհիվ Չիկագոյի համալսարանի հրատարակչության ներքո հրապարակված բոլոր հոդվածները հասանելի են դարձել Semantic Scholar-ի կորպուսում[23]։ 2020 թվականի վերջին Semantic Scholar-ը ինդեքսավորել էր 190 միլիոն հոդված[24]։ 2020 թվականին Semantic Scholar-ը ունեցել է ամսական յոթ միլիոն օգտատեր[25]։

Ծանոթագրություններ

[խմբագրել | խմբագրել կոդը]
  1. Eunjung Cha, Ariana (2015 թ․ նոյեմբերի 3). «Paul Allen's AI research group unveils program that aims to shake up how we search scientific knowledge. Give it a try». The Washington Post. Արխիվացված օրիգինալից 2019 թ․ նոյեմբերի 6-ին. Վերցված է 2015 թ․ նոյեմբերի 3-ին.
  2. Hao, Karen (2020 թ․ նոյեմբերի 18). «An AI helps you summarize the latest in AI». MIT Technology Review (անգլերեն). Վերցված է 2021 թ․ փետրվարի 16-ին.
  3. «Semantic Scholar Research». research.semanticscholar.org. Վերցված է 2021 թ․ նոյեմբերի 22-ին.
  4. 4,0 4,1 Fricke, Suzanne (2018 թ․ հունվարի 12). «Semantic Scholar». Journal of the Medical Library Association (անգլերեն). 106 (1): 145–147. doi:10.5195/jmla.2018.280. ISSN 1558-9439. PMC 5764585. S2CID 45802944.
  5. Matthews, David (2021 թ․ սեպտեմբերի 1). «Drowning in the literature? These smart software tools can help». Nature. Վերցված է 2022 թ․ սեպտեմբերի 5-ին. «...the publicly available corpus compiled by Semantic Scholar – a tool set up in 2015 by the Allen Institute for Artificial Intelligence in Seattle, Washington – amounting to around 200 million articles, including preprints.»
  6. Grad, Peter (2020 թ․ նոյեմբերի 24). «AI tool summarizes lengthy papers in a sentence». Tech Xplore (անգլերեն). Վերցված է 2021 թ․ փետրվարի 16-ին.
  7. «Allen Institute's Semantic Scholar now searches across 175 million academic papers». VentureBeat (ամերիկյան անգլերեն). 2019 թ․ հոկտեմբերի 23. Վերցված է 2021 թ․ փետրվարի 16-ին.
  8. Hao, Karen (2020 թ․ նոյեմբերի 18). «An AI helps you summarize the latest in AI». MIT Technology Review (անգլերեն). Վերցված է 2021 թ․ փետրվարի 16-ին.
  9. Bohannon, John (2016 թ․ նոյեմբերի 11). «A computer program just ranked the most influential brain scientists of the modern era». Science. doi:10.1126/science.aal0371. Արխիվացված օրիգինալից 2020 թ․ ապրիլի 29-ին. Վերցված է 2016 թ․ նոյեմբերի 12-ին.
  10. Christopher Clark; Santosh Divvala (2016), PDFFigures 2.0: Mining figures from research papers, Proceedings of the 16th ACM/IEEE-CS on Joint Conference on Digital Libraries - JCDL '16 (անգլերեն), Wikidata Q108172042
  11. «Semantic Scholar | Frequently Asked Questions». Արխիվացված օրիգինալից 2023 թ․ հուլիսի 15-ին.
  12. «Semantic Scholar | Semantic Reader». Semantic Scholar. Արխիվացված օրիգինալից 2023 թ․ հուլիսի 15-ին.
  13. «Semantic Scholar». International Journal of Language and Literary Studies. Վերցված է 2021 թ․ նոյեմբերի 9-ին.
  14. Baykoucheva, Svetla (2021). Driving Science Information Discovery in the Digital Age (անգլերեն). Chandos Publishing. էջ 91. ISBN 978-0-12-823724-3. OCLC 1241441806.
  15. Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo; Ferro, Nicola; Silva, Mário J.; Martins, Flávio (2020). Advances in Information Retrieval: 42nd European Conference on IR Research, ECIR 2020, Lisbon, Portugal, April 14–17, 2020, Proceedings, Part I (անգլերեն). Cham, Switzerland: Springer Nature. էջ 254. ISBN 978-3-030-45438-8. OCLC 1164658107.
  16. Ammar, Waleed (2019). «Open Research Corpus». Semantic Scholar Lab Open Research Corpus. Արխիվացված է օրիգինալից 2019 թ․ մարտի 29-ին. Վերցված է 2024 թ․ օգոստոսի 5-ին.
  17. Fricke, Suzanne (2018 թ․ հունվարի 12). «Semantic Scholar». Journal of the Medical Library Association (անգլերեն). 106 (1): 145–147. doi:10.5195/jmla.2018.280. ISSN 1558-9439. PMC 5764585. S2CID 45802944.
  18. Hannousse, Abdelhakim (2021). «Searching relevant papers for software engineering secondary studies: Semantic Scholar coverage and identification role». IET Software (անգլերեն). 15 (1): 126–146. doi:10.1049/sfw2.12011. ISSN 1751-8814. S2CID 234053002.
  19. «AI2 scales up Semantic Scholar search engine to encompass biomedical research». GeekWire (ամերիկյան անգլերեն). 2017 թ․ հոկտեմբերի 17. Արխիվացված օրիգինալից 2018 թ․ հունվարի 19-ին. Վերցված է 2018 թ․ հունվարի 18-ին.
  20. «Tech Moves: Allen Instititue Hires Amazon Alexa Machine Learning Leader; Microsoft Chairman Takes on New Investor Role; and More». GeekWire. 2018 թ․ մայիսի 2. Արխիվացված օրիգինալից 2018 թ․ մայիսի 10-ին. Վերցված է 2018 թ․ մայիսի 9-ին.
  21. «Semantic Scholar». Semantic Scholar. Արխիվացված օրիգինալից 2019 թ․ օգոստոսի 11-ին. Վերցված է 2019 թ․ օգոստոսի 11-ին.
  22. «AI2 joins forces with Microsoft Research to upgrade search tools for scientific studies». GeekWire. 2018 թ․ դեկտեմբերի 5. Արխիվացված օրիգինալից 2019 թ․ օգոստոսի 25-ին. Վերցված է 2019 թ․ օգոստոսի 25-ին.
  23. «The University of Chicago Press joins more than 500 publishers working with Semantic Scholar to improve search and discoverability». RCNi Company Limited (անգլերեն). Վերցված է 2021 թ․ նոյեմբերի 22-ին.
  24. Dunn, Adriana (2020 թ․ դեկտեմբերի 14). «Semantic Scholar Adds 25 Million Scientific Papers in 2020 Through New Publisher Partnerships» (PDF). Semantic Scholar. Արխիվացված է օրիգինալից (PDF) 2021 թ․ նոյեմբերի 15-ին. Վերցված է 2021 թ․ նոյեմբերի 22-ին.
  25. Grad, Peter (2020 թ․ նոյեմբերի 24). «AI tool summarizes lengthy papers in a sentence». Tech Xplore (անգլերեն). Վերցված է 2021 թ․ փետրվարի 16-ին.