امروزه انسانها در حجم بی پایانی از اطلاعات غرق شدهاند. محتوای اطلاعات شامل نشریهها، نقدها، مشاهدات، عکس و ویدئو درباره هرچیز ممکن است.
برآورد میشود که 2.77 بیلیون استفاده کننده منظم و دائم از این رسانهها استفاده میکنند و تکنولوژی با زمینههایی چون پیشرفت سرعت اینترنت و دستگاههای موبایلی که روز به روز پیشرفته تر میشوند، به افزایش تعداد استفاده کنندههای رسانههای جمعی کمک میکنند. دانشمندان اطلاعات میتوانند پستهای رسانههای جمعی را بررسی کرده و از اطلاعات آن در پهنه عظیمی از مطالعات مانند وضعیت ترافیک، بیماریهای بالقوه و تاثیرات آن بر جامعه و… استفاده کنند.
در دانشگاه ایالتی سن دیگو (SDSU)، مرکز مطالعات فعالیتهای انسان در عصر موبایل HDMA با رویکرد تغییر شکل مطالعات آکادمیک به اطلاعات کاربردی که میتواند به گرفتن تصمیمات دقیق و بی عیب و تغییرات منطقی سیاستهای اجتماعی راهنمایی کند . HDMA بین نظامهای مختلفی چون جغرافیا، علم کامپیوتر، مهندسی شهری، جامعه شناسی، سلامت اجتماعی، زبان شناسی، حسابداری، سیستم مدیریت دادهها، ارتباطات، علوم انسانی دیجیتال و… فعالیت میکند و تئوریهای علمی و مدلهای محاسبه ای برای فعالیتهای انسانی و… را تقویت میکند.
Tsou پروفسور دانشگاه ایالت سن دیگو و رییس و هدایت کنندهی HDMA گفته است: «برنامههایی از این قبیل به آیندهی تحصیلات اشاره دارد، زیرا آنها به جای مطالعات علمی محض، قابلیت نشان دادن نیازهای حقیقی را دارند.»
رئیس HDMA معتقد است که اطلاعات وابسته به مکان، حجیم، بدون نظم و گنگ را که به طور معمول نمیتوان تحلیل کرد را میتوان با استفاده از موقعیت جغرافیایی پستهای شبکههای اجتماعی تحلیل، دسته بندی و مورد استفاده قرار داد.
اخیراً، HDMA پروژهای برای تعیین الگوهای کاربری زمین شهری در پکن، چین انجام داده است. این گروه به مدت شش ماه، ۹.۵ میلیون برچسب جغرافیایی پیام رسانهای اجتماعی را از پایگاه رسانههای اجتماعی Sina-Weibo در مناطق مرکزی شهری پکن جمعآوری کرده و آنها را با ۳۸۵،۷۹۲ نقطه تجاری مورد علاقه (POI) از Datatang، یک ارائه دهنده محتوای دادههای دیجیتال چینی مقایسه کرد. برای برآورد انواع و الگوهای کاربری اراضی شهری، این تیم شبکهای به ابعاد ۴۰۰ * ۴۰۰ متر ایجاد کرد تا مناطق مرکزی شهری را به ۱۸۴۹۲ سلول تقسیم کند.
Tsou توضیح داد: «با تجزیه و تحلیل روند زمانی پیامهای رسانههای اجتماعی در هر سلول با استفاده از الگوریتم خوشهبندی K – means، ما هفت نوع خوشه کاربری اراضی در پکن شناسایی کردیم: مناطق مسکونی، خوابگاههای دانشگاهی، مناطق تجاری، مناطق کاری، مراکز حمل و نقل، و دو نوع منطقه کاربری اراضی مختلط. متن کاوی، ابر کلمات، و تجزیه و تحلیل توزیع POI برای بررسی موفقیت آمیز انواع کاربری اراضی برآورد شده، استفاده شدند. این روش میتواند به برنامه ریزان شهری کمک کند تا الگوهای به روز کاربری زمین را به شیوهای مقرون به صرفه ایجاد و تحلیل کنند و الگوهای پویای فعالیت انسانی در یک شهر را بهتر بشناسند.»
HDMA چندین برنامه کامپیوتری را توسعه داده است تا به طور خودکار یا نیمه خودکار دادههای رسانههای اجتماعی را از Twitter،Sina-Weibo،Google Places و Reddit جمعآوری کند. دادهها در MongoDB، یک پایگاه داده NoSQL ذخیره میشوند. NoSQL راهی برای ذخیره و بازیابی دادههایی ارائه میدهد که در روابط جدولی مدلسازی نشده اند، روشی که در پایگاههای داده رابطهای یا SQL استفاده میشود.
این دادهها همچنین از MongoDB به بستر ArcGIS برای ایجاد نقشههای نقطهای و هستههای تراکم صادر میشوند. علاوه بر این، HDMA ArcGIS Enterprise را برای قابلیتهای GIS و ArcGIS GeoEvent سرور برای یک پروژه خاص که برای بخش اداره خدمات اضطراری سن دیگو انجام میدهد، نصب کردهاست. این پروژه شامل جمع آوری و پردازش فیدهای دادههای ترافیکی در زمان واقعی از Waze، ترافیک مبتنی بر جامعه و برنامه هدایت جمع شده است. GeoEvent سرور میزبان لایههای داده ایجاد شده برای یک سرویس ArcGIS Online در این شهرستان خواهد بود.
این مرکز برای بررسی و نشان دادن اطلاعات جمع آوری شده از شبکههای اجتماعی دو مجموعه ابزار نرمافزاری ساخته است که اولی وظیفه جمع آوری هوشمند اطلاعات از شبکههای اجتماعی و دومی وظیفه نمایش اطلاعات و نتایج بررسی اطلاعات را روی نقشههای جغرافیایی برعهده دارد.
Tsou گفت: «فراداده جمع آوری شده توسط رسانههای اجتماعی شامل اطلاعات کاملی است، مانند هویت نویسنده، زمانی که پست قرار میگیرد، مکان جغرافیایی پست، محتوای پست، تعداد ارسالها، و غیره.»
در حالی که تمام این دادهها به طور باور نکردنی مفید هستند، نگرانیهای مربوط به حریم خصوصی را نیز به وجود میآورند، که Tsou و تیم او به شدت از آن آگاه هستند.
او گفت: «تحقیقات ما در HDMA در مورد مسائل حریم خصوصی است و ما سعی میکنیم تا جایی که میتوانیم از حریم خصوصی کاربران حفاظت کنیم. به عنوان مثال، نرمافزار GeoViewer شامل تکنیکهای geomasking برای تصادفی کردن مکانهای واقعی برچسب جغرافیایی کاربران در شعاع ۱۰۰ متری میباشد، اگرچه این امر ممکن است اندکی دقت نتایج تحلیل مکانی ما را کاهش دهد.»
او فکر میکند که GIScience و علم داده به شدت یکپارچه خواهند شد.
او گفت: «این امر امکان ایجاد یک رشته جدید را فراهم میکند که من آن را علم داده مکانی مینامم. آن را به عنوان یک رشته بین رشتهای میدانم که با استفاده از منابع محاسبات عملکرد بالا، آمار مکانی و غیرمکانی، مدلهای تحلیل فضایی- زمانی، الگوریتم های GIS، روشهای یادگیری ماشین، و ابزارهای geovisualization دانش و بینش را از دادههای بزرگ مکانی استخراج میکند.»
او همچنین انتظار دارد که Esri Geospatial Cloud به دلیل زیرساخت جامع سایبر خود، نقش کلیدی در این زمینه جدید ایفا کند.
Tsou توضیح داد: «بسته فناوری یکپارچه آن شامل یک مرکز داده جغرافیایی برای به اشتراک گذاری داراییها و تسهیل تعامل جامعه، خدمات ابری، ابزارهای تحلیلی آنلاین، پردازش دادههای بزرگ در زمان واقعی، و مجموعه خوبی از گزینههای ارائه است. معتقدم که علم دادههای مکانی، تفکر مکانی انتقادی و حل مساله را برای کاربردها و صنایع مختلف تسهیل خواهد کرد و کشف نظریههای علمی جدید را ممکن میسازد.»
مشاهده متن کامل انگلیسی از اینجا
خلاصه فارسی از : محیا زاهدی پور
کد مطلب : 98121701