شاخص های استناد به نسل بعدی - مروری بر چشم انداز در سال 2020 (I)

ساخت وبلاگ

از نظر شاخص های استناد به انضباطی متقاطع که برای کشف استفاده می شود ، همه از این دو متقاضی - Web of Science و Scopus (2004) می دانند. با پیوستن به مقیاس وب بزرگ Google Scholar (2004) ، این سه نفر به عنوان "3 بزرگ" شاخص های استناد برای تقریباً یک دهه کم و بیش بدون چالش سلطنت کردند.

با این حال ، 10 سال بعد ، حدود سال 2015 و در سالهای بعد ، نسل جدیدی از شاخص های استناد شروع به ظهور کرد تا Big 3 را از روش های مختلف به چالش بکشد.

از زمان نوشتن در سال 2020 ، برخی از این چالش های جدید چند سال توسعه داشته اند. اکنون همه چیز به نظر می رسد؟

اول از همه ، با استفاده از تکنیک های جدیدتر و پارادایم ها ، ما شرکت های انتفاعی مانند Digital Science Dimensing Dimensions (2018) داریم که من را به عنوان چالش برانگیز به Scopus و Web of Science در عرصه استناد/ارزیابی کتاببینیومتریک ، دقیقاً همانطور که خود Scopus یک چالش بود ، به من اعتصاب می دهند. در سال 2004 به شبکه قدیمی علوم.

در انتهای دیگر طیف ، ما افزایش شاخص های استناد "باز" بیشتری داریم. به طور خاص ، یک بازیگر بسیار مهم در این زمینه ، مجدداً Microsoft Academic (2016) است که نه تنها از فن آوری های سبک خزنده وب مانند Google Scholar برای پاک کردن وب استفاده می کند ، جدیدترین در پردازش زبان طبیعی (NLP) /"معنایی" را اعمال می کند ومجموعه داده های Dubbed Microsoft Academic Graph (MAG) را با مجوزهای باز در دسترس قرار می دهد.

جدید [مه 2021]: Microsoft Research اعلام کرده است که آنها از 31 دسامبر 2021 MAG را قطع می کنند. این یک ضرر عالی است ، اگرچه منابع دیگر استنادها و داده های باز در دسترس هستند. تحقیقات ما (تیم پشت Unpaywall) جایگزینی جزئی احتمالی به نام OpenAlex را اعلام کرده است

Semantic Scholar (2015) پروژه دیگری با Microsoft Lobies (تأمین شده توسط موسسه آلن برای AI) است که در همان عرصه بازی می کند و داده ها را با مجوزهای باز منتشر می کند (S2ORC Scient Scholar Open Research Corpus نسخه جدیدتر با برخی تفاوت های قابل توجه در مقابل است. محقق معنایی قدیمی تر تحقیقات باز). یکی از ویژگی های "معنایی" این موتور جستجو این است که استنادها را در مورد استناد به استناد به پس زمینه ، روش ها یا نتایج با استفاده از یادگیری ماشین ، انواع استناد می کند.

در حالی که Scite (2018) یک شاخص استناد جدید توسط یک استارتاپ داده های باز را ارائه نمی دهد ، این نقطه فروش استفاده از NLP برای نوع روابط استناد به "پشتیبانی" ، "اختلاف" و "خنثی" است که هنوز روش دیگری برای زمینه سازی استتحقیقات توسط توصیف روابط استناد.

علاوه بر این دو پروژه اندیشکده با بودجه به خوبی ذکر شده ، ما همچنین شاهد حرکاتی مانند حرکات مانند i4oc 2017 (Intiative for Open) هستیم - یک فشار شگفت آور موفق برای مجبور کردن ناشران به واریز و باز کردن منابع در CrossRef و همچنین تلاش های OpenCitations. NET (عضو موسس I4oc) برای استخراج استناد از مقالات دسترسی آزاد از PMC برای تولید OpenCitations Corpus (OCC) ، که برای افزایش بیشتر استخر متا داده های علمی و استنادهایی که در حوزه عمومی/CCO موجود است ، خدمت کرده اند. بشر

شاخص های جدید استناد به هیبریدی/ترکیبی ترکیبی

برای اولین بار با ترکیب برخی یا همه موارد زیر

الف) استنادهای باز که توسط ناشران در CrossRef باز شده است (حدود 50 ٪ از آثار با منابع در CrossRef اکنون به لطف I4oc باز است) -

ج) داده های موجود در نمودار آکادمیک مایکروسافت و منابع دیگر

اکنون برای استفاده جدید از شاخص های استناد "ترکیبی/ادغام شده" برای ایجاد از جمع آوری منابع فوق ، برای استفاده جدید از شاخص های استناد "ترکیبی/ادغام" امکان پذیر است. هنوز حتی با وجود مواد اولیه در دسترس ، هنوز هم نباید تلاش لازم برای ترکیب ، عادی سازی و تمیز کردن داده ها و همچنین تلاش برای ایجاد رابط های کاربر قانع کننده که ارزش آن را اضافه می کنند ، دست کم بگیرند.

حداقل نیمی از شاخص های استناد به کشف وجود دارد ، یک نمونه بارز Cambia's Lens. org (2017) است که با منابع ثبت اختراع (تخصص آنها) با متا داده های علمی و استناد از مایکروسافت دانشگاهی ، CrossRef ، Unpaywall ، PubMed ، Jisc Core ازدواج می کند. و بیشتر برای ایجاد یک شاخص استناد به کشف رایگان با ویژگی های جستجوی کاربر و ویژگی های تجسم.

موارد دیگر شامل Scinapse ، Naver Academic ، Scilit و موارد دیگر است. اما آیا این گزینه های جدید چیز جالب یا مورد نظر کاربران را به جدول اضافه می کند؟

چنین شاخص های استناد به نوع ترکیبی ، همچنین ممکن است دارای علائم سؤال از نظر سرعت به روزرسانی ها باشد (به عنوان مثال ، به تجزیه و تحلیل غیررسمی توسط متخصص Jeroen Bosman در اینجا و اینجا مراجعه کنید) پاکیزگی و سازگاری داده ها از ادغام بسیاری از منابع و سؤالات متنوعپایداری زیرا آنها به پروژه های بالادست و ابتکارات متکی هستند تا بتوانند مواد اولیه مورد نیاز برای ساخت شاخص را ارائه دهند (به عنوان مثال آیا تحقیقات مایکروسافت فقط به روزرسانی Microsoft Academic را متوقف می کند؟).

آنچه در زیر آمده است ، قسمت اول این سری است که مروری بر آنچه من "بزرگ 3" می نامم و ارزیابی من از نقاط قوت و ضعف آنها است.

این مورد توسط قسمت دوم دنبال خواهد شد ، که مروری بر تعداد انتخابی از شاخص های استناد به کشف جدید ، ویژگی های جالب آنها و ارزش آنها در دو حوزه مهم است

آ. به عنوان یک ابزار کشف برای افراد

ب. به عنوان یک ابزار ارزیابی تحقیق برای ردیابی و اندازه گیری عملکرد افراد ، گروه ها ، ادارات ، موسسه و حتی کشورها.

ابزارهای کشف مقایسه شده

شاخص های خدمات کشف/استناد که در این مقایسه گنجانده شده اند

  1. ابعاد (علوم دیجیتال)
  2. مایکروسافت دانشگاهی (تحقیقات مایکروسافت)
  3. محقق معنایی (موسسه هوش مصنوعی آلن)
  4. موتورهای مختلف "ترکیبی" جدید بر اساس ادغام منابع باز مانند Lens. org ، Scinapse ، Naver Academic ، Scilit - با تمرکز بر روی Lens. org (کامبیا)
  5. Scite (Scite) و دیگران "

توجه: برای مقایسه واجد شرایط بودن ، آنها می توانند به صورت رایگان یا تجارتی باشند ، دامنه های انضباطی متقابل را پوشش دهند (بنابراین به عنوان مثال meta. org مستثنی است) و تعداد استناد خود را ارائه می دهند (بنابراین ما جمع کننده های مخزن مگا مانند هسته یا پایه را حذف می کنیم. موتورهای جستجوگر کشف کتابخانه مانند Primo یا Summon²).

من همچنین بیشتر روی سیستمهایی تمرکز می کنم که انتظار می رود توسط کاربران در دنیای واقعی مورد استفاده قرار گیرد ، به همین دلیل من از OpenCitations Corpus (OCC) و Coci (شاخص OpenCitations از استنادهای CrossRef Open Open Doi-doi) استفاده می کنم)این مجموعه داده های بیشتری نسبت به موتورهای Seach برای کاربران نهایی است ، اگرچه برخی از آنها در واقع در برخی از فهرست های استناد ذکر شده در حال حاضر گنجانده شده اند.

  1. به طور کلی ، بسیاری از شاخص های استناد به کشف جدید امروز با هم مخلوط می شوند و استنادهای DEDUPE از منابع مختلف استناد به باز مانند Microsoft Academic ، CrossRef ، PubMed و غیره.
  2. سرویس های Library Discovery مانند Summon و Primo معمولاً نمایه های استنادی نیستند، اما کتابخانه هایی که مشترکین مشترک فهرست های استنادی مانند Scopus و Web of Science هستند، می توانند تعداد استنادات آن منابع را در Summon یا Primo مشاهده کنند. با این حال، Citation Trails هم در Summon و هم در Primo، مانند آغاز یک نمایه استناد با داده های استخراج شده از Crossref و منابع دیگر به نظر می رسد، اما من آنها را از این تجزیه و تحلیل حذف می کنم، زیرا این هنوز جزء اصلی چنین سیستم هایی نیست.
  3. این یک زمینه به سرعت در حال توسعه است، استارتاپ جالب دیگری که شاخص اکتشاف خود را از طریق برداشت وب تولید کرد، استارتاپ 1Science بود. محصول آنها در ابتدا OAfinder نام داشت و بعداً به 1Findr تغییر نام داد و در نهایت توسط Elsevier خریداری شد. همانطور که من این را می نویسم، مشخص نیست که آینده چیست، اما نسخه رایگان اکنون در https://1findr. 1science. com/home در دسترس است. یکی دیگر از موارد جالب ResearchGate است که نمایه استنادی خاص خود را دارد. یکی دیگر از مواردی که من از دست دادم این است که ScienceOpen یک مورد نسبتاً کوچک با 60 میلیون آیتم نمایه شده است. من زیاد با این یکی آشنا نیستم

بخش اول - مروری بر 3 بزرگ - Web of Science، Scopus و Google Scholar.

قبل از ورود به نسل جدید نمایه های استنادی، شاید مهم باشد که جایگاه سه شاخص استنادی بزرگ - Web of Science، Scopus و Google Scholar را در این زمینه درک کنید.

Web of Science البته نمایه استنادی OG است. در دهه 60 توسط یوجین گارفیلد شروع شد، نمایه استنادی Science همانطور که شناخته شد، سپس قبل از انتقال به اولین سیستم های کامپیوتری قدیمی در دهه 80، به صورت نسخه چاپی وجود داشت. این شرکت که در دهه 2000 متعلق به مجموعه ای از شرکت ها از جمله تامپسون رویترز بود، به عنوان یک شرکت جداگانه - Clarivate در سال 2015 منحل شد.

اگر از نظر اصطلاح گیج شده اید، Web of Science از نظر فنی نام پلت فرم وب است که پایگاه داده ها و فهرست های استنادی مختلف را در خود جای داده است. مهم ترین این پایگاه های اطلاعاتی/شاخص های استنادی آن هایی هستند که «مجموعه هسته» نامیده می شوند. به طور سنتی، این فهرست ها شامل فهرست استنادی علوم گسترده (SCIE)، نمایه استنادی علوم اجتماعی (SSCI)، فهرست استنادی هنر و علوم انسانی (AHCI) بوده و اکنون تعداد بیشتری وجود دارد، اما این ها مواردی هستند که هنوز بیشتر درباره آنها می شنوید.

با توجه به میراث آن ، وب علوم سالها دارای رابط تاریخ با محدودیت هایی برای جستجو است که به نظر می رسد برای چشم های مدرن عجیب است (به عنوان مثال به دلیل محدودیت های ذخیره سازی/پردازش روزهای گذشته ، فقط اولین نویسنده فهرست بندی شده و غیره) ، با این حال بخش عمده ای از آن. این کار به آرامی در 5 سال گذشته اصلاح شده است.

در همین حال ، الزویر در سال 2004 اسکوپوس را راه اندازی کرد که هدف از چنین ضعف هایی را به خود اختصاص داد. Scopus را می توان به عنوان وب علوم توصیف کرد اما با قابلیت های دهه 2000 در ذهن طراحی شده است و در نتیجه دارای UI نسبتاً مدرن و قابلیت های جستجوی بهتر است.

محتوای عاقلانه ، هنگامی که Scopus برای اولین بار راه اندازی کرد ، به عنوان یک شاخص استناد قرار گرفت که از نظر عناوین ژورنال بیشتر از Web of Science زمینه های بیشتری را در بر می گرفت. از طرف دیگر ، در آن زمان ، Scopus تازه وارد نمی توانست با نمایه سازی گذشته نگر از منابع Science از منابع (که بسیاری از آنها در آن زمان در قالب چاپ بودند) مطابقت داشته و خود را از سال 1996 و جدیدتر به فهرست بندی محتوا محدود کند.

امروز اختلافات بین این دو کاهش یافته است ، Scopus برای پر کردن پرونده های پشتیبان خود تا دهه 70 به عقب رفته است (اگرچه وب علوم هنوز به عقب برمی گردد) ، در حالی که وب علوم به شاخص های اضافی مانند فهرست استناد به منابع نوظهور اضافه کرده است (ESCI) برای مقابله با استدلال مبنی بر اینکه وب علوم بیش از حد انتخابی است.

هم Scopus و هم Web of Science نیز به مواد منبعی که فقط مقالات ژورنال نیستند بلکه مقالات و کتابهای کنفرانس نیز هستند ، گسترش یافته اند.(به عنوان مثال فهرست استناد به کتاب Clarivate (BKCI) ، فهرست استناد به کنفرانس (CPCI))

انتقادات وب علوم و اسکوپوس

با این حال ، با وجود گسترش شاخص های استناد ، Scopus و Web of Science با مطالعات مختلف کتابشناسی و مقالات "علم علوم" به دلیل اینکه به سمت زمینه های STEM می شوند و در برابر مجلات زبان غیر انگلیسی مغرضانه هستند (به عنوان مثال نادیده گرفتن مجلات منطقه ای) مورد نقد قرار گرفته است. بشر

به ویژه ، زیرا استفاده از Scopus و Web of Science به عنوان منابع کتابشناسی بر رتبه های دانشگاه حاکم است (به عنوان مثال رتبه بندی و رتبه بندی QS به طور کلی فقط در نسخه های گذشته فقط Scopus یا Web of Science استفاده کرده اند) ، اعتقاد بر این است که استفاده از چنین شاخص های استناد به تنهایی ممکن است کافی نباشدبرای به دست آوردن یک تصویر واقعی از کیفیت و عملکرد تحقیق.

مطالعات اخیر 2020 مانند - مقایسه منابع داده های کتابشناختی: پیامدهای استحکام رتبه بندی دانشگاه و ارزیابی عملکرد دسترسی آزاد نهادی: روش ، چالش ها و ارزیابی نشان می دهد که اگر شما از متفاوت استفاده می کنید ، معیارها و سفارشات رتبه بندی با استفاده از معیارهای مختلف می توانند بسیار متفاوت به نظر برسند و می توانند بسیار متفاوت به نظر برسند. غالباً منابع بزرگتر از آنچه فقط در وب علوم یا Scopus وجود دارد.

بیایید اکنون به آخرین The Big 3 - Google Scholar ، احتمالاً بزرگترین منبع داده برویم.

وارد Google Scholar شوید

درست همانطور که اسکوپوس وارد بازار می شد و سرانجام جای جای خود را برای تشکیل یک دوپولی به دست می آورد ، یک رقیب جدید دیگر وارد بازار شد - Google Scholar.

بنابراین تا سال 2015 ، یک تخمین احتمالاً ایمن این است که Google Scholar شاید 160 میلیون مقاله داشته باشد و ممکن است تاکنون 200 میلیون گذشته باشد. در مقایسه Scopus در سال 2020 امروز حدود 70 میلیون مقاله نشان داده شده است.

وقتی در مورد فهرست ها با بیش از 100 میلیون مقاله می نویسم ، اغلب اظهار نظر می کنم که این غیرممکن است. از این گذشته ، Crossref اصلی ترین (اما نه تنها) آژانس ثبت نام DOI است که به محتوای علمی کمک می کند - فقط به 100 میلیون DOI صادر شده در سپتامبر 2018 رسید و حتی همه CrossRef Dois در مقالات ژورنال ثبت نشده است. پاسخ چند منظوره است ، به عنوان مثال همه مقالات ژورنال دارای DOI (یا حتی لزوماً یکی از Crossref) نیستند. اما بسیاری از مطالب موجود در برخی از شاخص ها ممکن است محتوای "نوع ژورنال" نباشند ، حتی چاپگرها (که امروزه توسط برخی از سرورهای preprint با DOI شروع می شود) ، اما ممکن است شامل پست های وبلاگ ، راهنماهای تحقیق و موارد دیگر باشد. مثل همیشه مراقب آمار باشید!

2. نمایه سازی کامل متن کامل ، رتبه بندی ارتباط عالی و فهرست بندی و پیوند به رایگان برای خواندن مقالات

ثانیاً همانطور که در گذشته نگر 10 ساله شرح داده شده است ، Anurag به سادگی در نمایه سازی ابرداده که برای همه A و در آن زمان استاندارد بود متوقف نشد. در عوض ، او به درب ناشران از Elsevier به ACS زد تا مجوز Google Scholar Crawlers را برای خزیدن در پشت Paywall بدست آورد تا متن کامل را نشان دهد.

در حالی که برخی از آنها در ابتدا مقاومت می کردند ، یک به یک ناشران به عنوان نادیده گرفتن ترافیک Google Scholar می توانستند به راحتی احمقانه باشند ، به خصوص اگر رقبای آنها این کار را نکردند (من تخمین ناشران را نشان می داد که بخش عمده ای از مراجعه های آنها از Google و Scholar و Scholar آمده است. نه سیستم های کتابخانه).

این واقعیت که Google Scholar متن کامل تقریباً همه ناشران اصلی را فهرست بندی می کند ، یک مزیت بزرگ است که من به ندرت ذکر کردم. توانایی Google Scholar برای نشان دادن قطعه هایی از آنچه که اصطلاحات پرس و جو شما در مقاله مطابقت دارد ، به شما می دهد مقدار مجنون زمینه ای که اگر متن کامل را نشان ندهید امکان پذیر نیست.

به راحتی می توانید بدون حتی وارد کردن کاغذ بگویید تا ببینید که آیا این مقاله احتمالاً مرتبط است یا خیر.

در واقع محبوبیت Google Scholar یک راز بزرگ نیست.

این اصول اولیه را به روشی متمرکز ، با پوشش تقریبا بی نظیر ، نمایه سازی متن کامل و رتبه بندی بسیار عالی در بسیاری از رشته ها انجام می دهد (که فکر می کنم خود تابعی از تعداد زیادی از چشم ها و کلیک هایی است که به Google کمک می کند تا ارتباط آنها را بهینه کند. رتبه بندی. این چیزی است که خدمات جدیدتر با هم تطبیق مشکل دارند).

یکی دیگر از دلایل محبوبیت آن که بندرت مورد توجه قرار می گیرد ، زیرا بیشتر افراد متقاضی وابسته به موسساتی با دسترسی به PayWall هستند این است که قبل از دسترسی آزاد یک چیز بزرگ بود ، Google Scholar تقریباً به صورت یک طرفه با یافتن و پیوند قابل اعتماد به رایگان برای خواندن نسخه ها در هر کجا که آن را حمل می کرد ، حمل می کرد. مدتها قبل از اینکه سایر موتورها و پایگاه داده های کشف کشف شروع به دسترسی رایگان برای خواندن مقاله ها کنند ، در دسترس بود (صفحه ژورنال ، مخزن ، شبکه تحقیقات دانشگاهی ، صفحه اصلی نویسنده).

حتی امروز ، بیشتر قابلیت های یافتن دسترسی آزاد که در پایگاه داده ها مشاهده می کنید از طریق Unpaywall است و Google Scholar هنوز یکی از مطمئن ترین منابع پیوند دهنده رایگان برای خواندن نسخه ها است.

یک نکته دیگر که ممکن است برای مناطق Humantities مرتبط باشد این است که Google Scholar Intereses منجر به نتایج Google Scholar از نتایج سرویس Google Books می شود. این یک سرویس کاملاً منحصر به فرد است ، تنها به دلیل همکاری در مقیاس بزرگ بین بزرگترین کتابخانه های دانشگاهی امکان اسکن دیجیتالی کتاب ها و همانطور که به خوبی شناخته شده است ، به چالش های کپی رایت رسیده است.

در حالی که ممکن است سازمانهایی مانند مایکروسافت بتوانند با خزیدن به وب برای فهرست بندی مقالات ژورنال ، خود Google Scholar را مطابقت دهند ، آنها چیزی برای مطابقت با Google Books ندارند و بعید است چنین آزمایشی تکرار شود ...

کتابخانه های دانشگاهی به Google Scholar واکنش نشان می دهند

در دهه 2010 ، كتابخانه ها سعی كردند نسخه خود را از Google Scholar ایجاد كنند و امیدهای خود را در "خدمات کشف مقیاس وب" مانند Summon ، Primo ، Eds و WorldCat Discovery پودر كردند.

هیچکدام از آنها نتوانستند در محبوبیت Google Scholar زیاد از این موضوع استفاده کنند.

ناشران دریافتند که اکثریت قریب به اتفاق ترافیک آنها از Google ، Google Scholar و همچنین PubMed سرچشمه می گیرد که همان چیزی است که Lorcan Dempsey با خدمات در سطح شبکه بر خلاف خدمات کشف کتابخانه ای که در سطح نهادی کار می کنند ، می نامد.

در حالی که من خیلی جسورانه نخواهم بود بگویم که Google Scholar تنها و بهترین ابزار کشف برای همه شرایط است (برای مثال ، یک ابزار انضباطی متمرکز مانند PubMed یا Psycinfo ممکن است حتی انتخاب بهتری باشد) ، اگر فقط یک ابزار را می شناسیدبرای استفاده در تمام موارد استفاده ، احتمالاً انتخاب پیش فرض برای استفاده از Google Scholar بد نیست.

Google Scholar به عنوان یک منبع کتاب مقدس

در حالی که شاخص های استناد به طبیعت خود تعداد استناد را ارائه می دهند ، مسلماً بسیاری مانند Google Scholar بیشتر به جای ابزاری که برای مدیران ارشد و کتابشناسان برای انجام تجزیه و تحلیل کتاب مقدس و ارزیابی های تحقیق طراحی شده است ، بیشتر به عنوان یک ابزار کشف متمرکز شده اند.

آنها حتی شروع به گسترش به سمت تهیه و ردیابی معیارها کردند ، پروفایل های Google Scholar را در سال 2011 راه اندازی کردند و معیارهای محقق را در سال 2012 ایجاد می کنند و رتبه بندی سالانه مجلات - که با لیست های مجله رتبه بندی شده - توسط Clarivate - گزارش های استناد به ژورنال و معیارهای مجله Scopus توسط Elesvier.

چگونه Google Scholar در این تلاش برای ورود به بازی استناد در مقابل Scopus و Web of Science فرار کرده است؟

حس من از موضوع این است که از نظر یک ابزار جستجوی کشف ، Google Scholar مدتهاست که Web of Science یا Scopus را انتخاب کرده است (همچنین به نظرسنجی های مختلف در مورد رفتار محقق مانند این گزارش JISC در سال 2015 مراجعه کنید). مطمئناً در حالی که برخی از محققان مدرسه (یا اساتید قدیمی مدرسه که شغل خود را شروع کرده اند ، در جایی که شاخص استناد علمی همه قدرتمند یا از کشورهای خاصی بود که انتشار در مجلات "SSCIE" یک چیز بزرگ است اما حتی ممکن است به زودی پایان یابد) ،چه کسی اصرار دارد که در وب علوم یا Scopus به منازل بپردازد زیرا آنها فقط می توانند آن مجلات موجود در آن شاخص ها را ذکر کنند ، اما به طور کلی توسط محققانی که اولین غریزه آنها جستجوی Google Scholar است ، به ویژه در زمینه هایی که در زمینه های کمتری تحت پوشش وب قرار می گیرند ، بیشتر از آنها می توانند استناد کنند. علم

اما در مورد استفاده از Google Scholar به عنوان منبع کتابشناسی برای ارزیابی چیست؟

شکی نیست که فکر می کنم پروفایل های Google Scholar به دلیل سهولت در تنظیم و نگهداری ، افزایش دید بسیار محبوب هستند (حتی این امکان را برای شما فراهم می کند که در پانل دانش Google برای جستجوی گوگل ظاهر شوید!).

و محققانی وجود دارند که عاشق معیارهای Google Scholar برای تعداد استناد بالاتر آنها هستند ، که به طور معمول با استفاده از نرم افزار انتشار یا هشدار هارزینگ استخراج می شوند ، تنها ابزاری که به طور رسمی مجاز است (یا حداقل پیشنهاد می شود توسط برخی از آنها) توسط Google Scholar برای ضبط نتایج حاصل از Google از Google استفاده کند. محقق برای تجزیه و تحلیل کتابشناسی.

یکی از سؤالات متداول در مورد Google Scholar این است که چرا API یا راهی برای داده های استخراج فله ارائه نمی دهد. در حال حاضر راه هایی برای به دست آوردن داده های Rich Google Scholar در مورد توده ، محدود به خراش دادن از صفحات تحقیقاتی GS با استفاده از اسکریپت ها ، پسوندهای مرورگر و سایر ابزارها (مشهورترین انتشار یا هلاک شدن Hazing است.) این روش ها برای استفاده در مقیاس بزرگ بسیار محدود هستند وهرچند دائماً اقدامات متضاد مانند Captchas را پرتاب می کند. من نمی دانم که آیا پاسخ رسمی وجود دارد که چرا Google Scholar یک API ندارد ، اما اعتقاد عمومی/سوء ظن این است که در ازای Google Scholar اجازه می دهد تا متن کامل را در پشت ناشر PayWalls فهرست بندی کند ، مجاز نیستمحتوا را از طریق API تهیه کنید.(با نحوه عملکرد مایکروسافت API مقایسه کنید اما متن کامل را ارائه نمی دهد/فهرست نمی کند).

با این حال ، به طور کلی در مسابقه پذیرش به عنوان ارائه دهنده متریک Google Scholar یک سوم دور در بهترین حالت برای دو نفر دیگر است. بخشی از آن برخلاف Web of Science یا Scopus است ، هیچ راهی آسان برای به دست آوردن داده های Google Scholar به صورت عمده وجود ندارد ، به دلیل کمبود API یا رابط هایی که برای تجزیه و تحلیل عمیق کتابشناسی طراحی شده اند (Clarivate افزودنی را در INCITES ارائه می دهد و Elsevier Scival را ارائه می دهد)

همچنین این حس هنوز هم فقط تعداد استناد و معیارهای "شاخص های استناد مناسب" مانند Web of Science و Scopus Count است. مربوط به این ایده اما در حال حاضر تا حدودی کمتر برگزار می شود ، ایده فقط انتشار در ژورنال ایندکس شده در این فهرست استناد است

برخی از این موارد بی تحرکی خالص است ، کمی ریشه در این ایده احتمالاً درست است که داده های Google Scholar هنوز بیش از حد نجس و نادرست است که در مقایسه با Scopus و Web of Science استفاده می شود. اما من فکر می کنم این واقعیت که رتبه بندی های معتبر دانشگاه همه از Scopus یا Web of Science استفاده می کنند قطعاً ارتباطی با آن نیز دارد.

من استدلال می کنم تا زمانی که Scopus و Web of Science به عنوان ابزارهای de facto برای اندازه گیری و ارزیابی تحقیقات ، دست خود را حفظ کنند ، نقش های کاهش یافته آنها در Discovery (که بیشتر از Google Scholar گرفته شده است) به آنها آسیب نمی رساند.

آیا ارزش پرداخت هزینه زیادی برای داده های با کیفیت بهتر دارد؟

هزینه های کیفیتنمایندگان Clarivate و Elsevier بدون شک با این استدلال برچسب های قیمت محصولات خود را توجیه می کنند. هنگامی که آنها تنها بازی در شهر بودند ، این استدلال قوی بود ، اما اکنون با ظهور رقبا ، بسیاری از آنها رایگان هستند (مایکروسافت دانشگاهی ، Coci و غیره) ، این استدلال دوباره آن را به سر می برد ، به ویژه هنگامی که پوشش برخی از مجموعه داده های باز قابل مقایسه استیا بزرگتر (به عنوان مثال از نمودار آکادمیک Micosoft). اگرچه توجه به پوشش و کیفیت/دقت ممکن است با هم ارتباط نداشته باشد.

پوشش نسبی منابع مختلف استناد جدید در مقابل Web of Science و Scopus چیست؟مطالعات در مورد این موضوع هنوز هم بی شمار نیست اما به طور کلی الگوهای شروع شده است - از نظر پوشش (اندازه گیری شده توسط استناد) - Google Scholar بزرگترین در پوشش و پس از آن توسط Microsoft Academic (داده های باز در دسترس از طریق نمودار آکادمیک مایکروسافت) است. ابعاد ، Scopus و Web of Science از نظر اندازه در ردیف بعدی قرار دارند.

متأسفانه ، مجموعه استنادهای باز در CrossRef به عنوان مثالCoci Opencitations (که از داده های CrossRef گرفته شده است و بر روی پیوندهای استناد به DOI به DOI متمرکز شده است) به دلیل نگه داشتن تعداد کمی از ناشران بزرگ ، یعنی Elsevier ، ACS ، IEEE که از انجام منابع باز از روزنامه های خود امتناع می ورزد ، عقب را به خود می گیرد. به CrossRef سپرده می شوند.

به روزرسانی مارس 2021!- Elsevier با اعلام اینکه آنها اعلامیه ارزیابی تحقیق (DORA) را امضا می کنند که شامل نیاز به تهیه لیست های مرجع کلیه مقالات است که از طریق CrossRef در دسترس است ، دنیای دانشگاهی را امضا می کند. این یک شلیک بزرگ در بازو است تا شکاف گمشده استنادها در Crossref را احساس کنید! Kluwer و ACS از آن زمان در سال 2021 از این پرونده پیروی کرده اند و اکنون 87 ٪ از مقالات در Crossref دارای منابع هستند!

همانطور که می بینید Google Scholar 88 ٪ از کل مجموعه های جمع شده را پوشش می دهد ، در حالی که نزدیکترین رقیب مایکروسافت آکادمیک فقط 60 ٪ را پوشش می دهد.

رفتن به مدرسه قدیمی تر

این مدتهاست که توسط محققان و کتابداران متخصص در بررسی های سیستماتیک شناخته شده است که Google Scholar اجازه کنترل خوبی از جستجوها را نمی دهد.

در میان برخی از ویژگی هایی که فاقد آن است

  1. پشتیبانی از نمایش داده های پیچیده طولانی - جستجو به 256 کاراکتر محدود می شود
  2. پشتیبانی از جستجوهای بولی تو در تو
  3. بدون کارت وحشی و پشتیبانی مجاورت (Autostemming پشتیبانی می شود ، به راحتی نمی توان خاموش کرد)
  4. فقط پشتیبانی محدود از جستجوی زمینه های خاص
  5. حداکثر 1000 نتیجه ، بدون صادرات فله

این واقعیت را نیز اضافه کنید که همچنین اعتقاد بر این است که نتایج جستجوی Google Scholar همیشه قابل تکرار نیست و حتی ترس از حباب Google Scholar (که ممکن است از بین نرود یا نباشد) و به نظر می رسد این مناطقی است که رقیب می تواند در آن بهبود یابد.

به نظر می رسد این Rocky Lens. org با ویژگی های جستجوی ساختاری بسیار قدرتمند مانند بسیاری از جستجوهای میدانی و جنبه ها و همچنین نحو جستجوی پیشرفته Boolean در نظر گرفته شده است. من Lens. org را در قسمت 2 این سریال مرور خواهم کرد ، اما در حال حاضر اگر کنجکاو هستید نگاهی بیندازید - 7 دلیل که باید Lens. org را امتحان کنید (به روز شده در نسخه نسخه 5. 16. 0 - مارس 2019)

این گفته است که بازار کاربرانی که چنین ویژگی هایی می خواهند چقدر بزرگ است؟به نظر می رسد بیشتر محققان با کنترل محدودی که در Google Scholar دارند ، تحقیر می شوند.

رفتن بیشتر "معنایی" و فشار 10 پیوند آبی گذشته

ثانیا ، می توان رویکرد متضاد را در پیش گرفت و به سمت جستجوی کاملاً معنایی برای انجام کار سوق داد.

منظور من از این چیست؟

در حالی که Google Scholar همانطور که قبلاً دیدیم 100 ٪ کاملاً بولی نیست ، اما هنوز هم دارای یک سیستم جستجوی کلمات کلیدی است ، می توانید از یا توابع استفاده کنید ، نقل قول هایی را برای جستجوی عبارت و غیره انجام دهید. ممکن است متوجه نشود که Google Scholar ممکن است گاهی اوقات با گسترش شرایط ، رها کردن یک یا دو دوره و غیره ، بخشی از جستجوهای شما را تغییر دهد).

اما این چیزی در مقایسه با سیستمهایی مانند Microsoft Academic یا Semantic Scholar نیست ، جایی که اپراتورهای بولی حتی موارد ساده ای مانند آن را بیرون می کشند و یا کاملاً از پنجره بیرون می روند و سیستم سعی می کند جستجوی شما را تفسیر کند.

و البته Google Scholar در افزودن ویژگی ها به Google Scholar (حداقل در سطح) و برای 25 سال گذشته کاملاً محافظه کار بوده است ، در حالی که Google با افزودن نمودارهای دانش ، فراتر از "10 الگوی لینک آبی" پیشرفت کرده است ، Snipplet را از آن استفاده می کند. صفحات وب برای رسیدگی به نمایش داده های پرسش و پاسخ و حتی آخرین تکنیک های NLP مانند Bert ، مشخص نیست که Google Scholar چقدر از تغییرات عمومی بهره مند شده است.

شاید برخی از ویژگی های جدید "معنایی" نوآورانه برای اضافه کردن زمینه بیشتر به جستجوها می توانند به یک نفر در Google Scholar کمک کنند؟

تحقیقات غیرقانونی

یکی از رویکردهای اصلی من در برخی از شاخص های استناد جدیدتر دیده ام ، فشار به سمت تحقیق و تفحص با ردیابی پیوندها فراتر از پیوندهای بین مقالات یا حتی مقالات و کتابهای کنفرانس است.

به عنوان مثال ، ابعاد علوم دیجیتال پیوندهای بین انتشارات کاغذ ، کمک های مالی ، سرمایه گذاران ، آزمایشات Clincal ، مجموعه داده ها ، ثبت اختراعات ، اسناد خط مشی و غیره را ردیابی می کند.

Semantic Scholar همین کار را با پیوند دادن مقالات به پیش نویس ها ، اسلایدها ، فیلم ها ، ارائه ها ، کتابخانه های کد و حتی ذکرهای آنلاین انجام می دهد (توییت ، پست های وبلاگ ، اخبار).

منطقه جالب دیگر در استفاده از معناشناسی در رفتار استناد است.

به عنوان مثال به جای شمارش استنادها ، Semantic Scholar از تکنیک های NLP استفاده می کند تا انواع استناد را با استفاده از استناد از روش ، نتایج یا پیشینه و همچنین اگر مرجع در مقاله بسیار آنفلونالی است.

این به Semantic Scholar اجازه می دهد تا چرخش خود را در ویژگی "جستجوی مقاله" بسیار مفید Google Scholar قرار دهد که من اغلب هنگام جستجوی مقالات منی یا مرور مقالات با صدها نفر از آنها از آن استفاده می کنم.

در دانشمند معنایی در کنار فقط انجام یک کلمه کلیدی از مقالات استناد ، می توانید آن را با استفاده از معیارهای مختلف مانند استناد به نوع فیلتر کنید.

یکی از آخرین پیشرفت های Scite ، حتی به شما امکان می دهد تا دریل انتخابی را پایین بیاورید و از نوع استناد به نمودار استناد پیروی کنید و چرخش جدیدی را در مورد قدیمی استنادهای معدن ارائه دهید.

رفتن به دنبال نقش ارائه دهنده کتاب مقدس

البته ، در این مرحله مشخص نیست که آیا هیچ یک از این موارد جز ترفندهای جالب که از بین نمی روند ، نخواهد بود و ممکن است این باشد که بیرون رفتن از Google Scholar به عنوان یک ابزار کشف خالص ممکن است سودآور نباشد حتی اگر قابل انجام باشد.

در حالی که رقبایی مانند مایکروسافت علمی و معنایی دانشمند که از جیب های Rich Rich پشتیبانی می کنند می توانند در این بازی حضور داشته باشند ، بحث و گفتگو دشوار نیست ، تلاش برای کسب درآمد از صنعتی که Google Scholar عالی رایگان در آن وجود دارد و غول هایی مانند مایکروسافت تلاش می کنندبه نظر می رسد برای ارائه خدمات کشف به همان اندازه رایگان ، یک احمق است.

به نظر من تعداد فزاینده ای از شاخص های کشف که با استفاده از ابرداده های باز (به عنوان مثال Lens. org ، Scinapse) ظاهر می شود ، به نظر می رسد که اگر شما یک شرکت سود باشید ، بازی Discovery به سرعت در حال تبدیل شدن به یک وضعیت "اقیانوس قرمز" است.

شاید با شناخت این ابعاد توسط شرکت برای سود علوم دیجیتال ، یک سرویس کشف Fremium را که تقریباً با Google Scholar با اکثر ویژگی ها مطابقت دارد ، به شما ارائه می دهد (به عنوان مثال مانند Google Scholar ، Dimensions یک رویکرد فراگیر را شامل می شود که شامل تمام ژورنال هایی است که می تواند ببیند) و حتی از بین می رود. برخی از مجموعه های فیلتر اضافی دیگر.

با این حال ، من گمان می کنم ابعاد در واقع به معنای رقابت با Google Scholar نیست بلکه در Scopus و Web of Science و موقعیت های آنها به عنوان داوران کیفیت تحقیق بیشتر است.

بر خلاف مایکروسافت آکادمیک ، نسخه رایگان ابعاد در واقع فیلتر نهادی را در نسخه Fremium پنهان می کند ، با هوشمندانه این واقعیت را تشخیص می دهد که یک مورد اصلی استفاده می تواند کتاب مقدس در سطح موسسه باشد و آن را قفل کند تا از کتابخانه ها یا دفاتر تحقیقاتی که می خواهند از آن استفاده کنند ، اطمینان حاصل کنند. راه باید بپردازد.

شما می بینید که تصمیم مشابهی برای Elsevier به دست آورد 1Science 1Findr ، جایی که دوباره نسخه Freemium فاقد فیلترهای نهادی است

به Dimensons به عنوان یک شبکه علمی فراگیر تر ، Scopus در پوشش و برخلاف Google Scholar فکر کنید API ها و روش های آسان برای استخراج داده ها وجود دارد

با نگاهی به مجموعه ویژگی های اضافی ابعاد به علاوه و به ویژه در ابعاد ، ویژگی هایی مانند تجزیه و تحلیل سفارشی و داشبورد ، پشتیبانی از Google BigQuery و غیره ، فکر می کنم بدیهی است که محصول ممتاز بیشتر از افرادی که می خواهند پوشش فراگیر تر از آنچه هستند ، بیشتر از آنچه که هست ، بیشتر از آنچه می خواهند رنگ آمیزی شود. در Scopus یا Web of Science (مشابه Google Scholar) و دسترسی فله ای آسان به کتابشناسی برای ارزیابی (برخلاف Google Scholar).

البته تلاش برای سرنگونی Scopus یا Web of Science یا حداقل عضلات در تجارت آنها برای شناخته شدن به عنوان ارائه دهنده معتبر از معیارها ، کمتر از جابجایی Google Scholar در Discovery آسان نیست.

همانطور که قبلاً نیز گفته شد ، Scopus و Web of Science قبلاً در این زمینه ها نام تجاری ایجاد کرده اند و یک پایگاه داخلی هزاران کتابدار و محقق دارند که به ناچار خطاها را مشاهده می کنند و به بازخورد آن خطاها برای اصلاح کمک می کنند و منجر به داده های نسبتاً تمیز می شوند. بشر

همچنین ، برای اینکه یک شاخص استناد به عنوان اعتبار شناخته شود ، باید توسط بسیاری از محققان شخص ثالث مورد مطالعه قرار گیرد و Scopus و Web of Science برای تمام نقاط ضعف آنها به دلیل چندین دهه مطالعات بسیار خوب مورد مطالعه قرار می گیرد. این جایی است که علم دیجیتال کتاب مقدس را که علاقه مند به انجام تحقیقات در مورد داده های ابعاد برای درخواست دسترسی هستند ، تشویق کرده است. کار با کتابخانه ها و موسسات برای تلاش برای استفاده از داده های ابعاد برای اندازه گیری ، چیزی است که البته در حال انجام است.

از سال 2020 ، هنوز هم خیلی زود است که بگوییم آیا ابعاد قادر به گرفتن جایگاه برای به چالش کشیدن پیشروان خواهد بود ، اما امیدوار کننده به نظر می رسد. یکی دیگر از مدعیان ممکن برای کتاب مقدس ، داده های باز Microsoft Academic است که مجدداً دارای پوشش فراگیر مانند ابعاد و همچنین دسترسی فله آسان به داده ها از طریق API یا Azure Cloud Storage است (از نظر فنی داده ها رایگان است ، شما برای ذخیره سازی/دسترسی به لاجورد پرداخت می کنید).

نتیجه

دلیلی وجود دارد که Google Scholar و Web of Science / Scopus در عرصه های مختلف خود پادشاهان تپه ها هستند.

آنها دارای نام تجاری قوی ، شروع به کار در توسعه و انبوهی از چشم های چشم و کاربران هستند که منجر به یک چرخه تقریباً فضیلت بهبود می شوند. رقابت در برابر چنین رقبای خوب تثبیت شده حتی اگر جیب های عمیق (مایکروسافت) یا یک ایده قاتل (SCITE) داشته باشد ، آسان نیست.

به گفته این ، به نظر می رسد فشار به سمت منابع بازتر استنادها و ابرداده ادامه دارد.

به طور خاص ، استنادهای باز از Crossref در سال 2021 شوت بزرگی در بازو به دست آورده است ، که آخرین ناشر اصلی Elsevier ، ACS و Kluwer به این تیم پیوستند ، این مجموعه داده ها ممکن است شروع به رقابت کنند. به خصوص اگر با سایر منابع استناد باز مانند نمودار آکادمیک مایکروسافت (MAG) ادغام شوید.

جالب است بدانید که چگونه این منظره در سال 2030 به نظر می رسد.

دوره ی فارکس...
ما را در سایت دوره ی فارکس دنبال می کنید

برچسب : نویسنده : مهناز افشار بازدید : 29 تاريخ : شنبه 21 مرداد 1402 ساعت: 12:46