تازه های GIS – شماره ۱۹

Turn Raw Data into a Feature Layer

تبدیل داده‌های خام ( جدولی ) به یک لایه عارضه

اضافه کردن یک صفحه گسترده با داده‌های موقعیت مکانی، کد جغرافیایی و ایجاد کردن نقاط

غالباً، تحلیلگران داده و متخصصان GIS باید یک صفحه گسترده را در رایانه محلی به یک لایه عارضه تبدیل کنند. در این مثال‌، من یک صفحه گسترده محلی حاوی اطلاعات مربوط به هزینه درمانی برای هر بیمار در بیمارستان‌های مختلف دارم. زمینه‌هایی که شامل داده‌های مکان برای هر بیمارستان هستند؛ آدرس، شهر، ایالت و کدپستی نامیده می شوند.

من به حساب سازمانی ArcGIS Online خود وارد شده‌ام و یک نوع کاربری دارم که به من امکان می‌دهد لایه‌های عارضه میزبانی شده (ایجاد کننده، GIS حرفه ای یا انواع کاربری تحلیلگر مفهومی) را منتشر کنم. برخی از اعتبارات تجزیه و تحلیل این روش‌ها را براساس تعداد سوابق موجود در داده‌ها دارم.

در بخش My Content در ArcGIS Online ، گزینه Add Item را از رایانه انتخاب می‌کنم و به پرونده CSV حرکت می‌کنم. ArcGIS Online از من می‌خواهد که این پرونده را به عنوان یک لایه عارضه میزبانی شده منتشر کنم، با توجه به این واقعیت که داده‌ها دارای فیلدهای آدرس را انتخاب کرده و از آن به عنوان فیلدهای مکان استفاده کند.

بررسی می‌کنم که آدرس، شهر، ایالت و کدپستی مطابقت دارند. در این حالت، به صورت دستی زمینه نامگذاری شده کدپستی را به صورت ZIP تنظیم می‌کنم.

مطمئن می‌شوم که عنوان و برچسب‌های جستجو همان چیزی است که می‌خواهم و سپس بر روی افزودن مورد کلیک می‌کنم. بسته به تعداد سوابق، انتشار آن چند دقیقه طول می‌کشد. پس از انتشار، کادر محاوره‌ای ظاهر می‌شود که می‌گوید تعداد مکان‌ها با یکدیگر مطابقت دارند و فرصتی برای بررسی موارد مرتبط نشده دارم.

پس از ایجاد آیتم، ArcGIS Online به طور خودکار به صفحه جزئیات آیتم‌های لایه عارضه نقطه‌ای جدید هدایت می‌کند. (توجه: اگر صفحه گسترده شما به جای زمینه‌های آدرس دارای داده‌های مختصات طول و عرض جغرافیایی باشد، روند بسیار مشابه است.)

چه زمانی به یک لایه از عارضه‌های موجود ملحق شویم

همچنین می‌توانم به سادگی داده‌های خود را به عنوان جدول وارد کرده و سپس به یک لایه عارضه موجود ملحق شوم. چه زمانی بهتر است یک صفحه گسترده به جای جداول کدگذاری به عنوان جدول وارد شود؟

اگر یک صفحه گسترده بدون آدرس یا مختصات طول و عرض جغرافیایی داشته باشم اما هنوز نیاز به وارد کردن این داد‌ ها به یک گردش کار GIS داشته باشم، شاید بتوانم از شناسه بیمارستان، نام دانشگاه یا سایر داده‌های مشخصه خاص که توسط geocoder برداشت نمی‌شود اما می‌تواند توسط ویژگی‌ها به لایه نقاط موجود در My Content در ArcGIS Online ملحق شود استفاده کنم.

اگر بخواهم به جای نقطه با خط یا چند ضلعی کار کنم، می‌توانم با نگاهی به دسته بندی مرزهای ArcGIS Atlas Living of the World برای لایه‌های چند ضلعی کشورها، ایالت‌ها و استان‌ها، کدهای منطقه تلفن، مناطق کنگره، مناطق زمانی جهانی، شهرستان‌ها، آبگیرها و موارد دیگر را پیدا کنم و بتوانم از آن‌ها استفاده کنم.

یک صفحه گسترده از سایت داده‌های رتبه بندی بخش سلامت شهرستان و مستندات دریافت کردم که در حین بارگیری به آن analytic_data 2019_0.csv گفته شد. ردیف اول در CSV دارای اسم توصیفی (مانند مقدار خام مرگ زودرس) است که برای نام‌های مستعار استفاده خواهم کرد. ردیف دوم نام متغیر کوتاه است که برای اهداف برنامه نویسی در بسته‌های آماری استفاده می‌شود و مربوط به فرهنگ لغت داده‌ها (مانند v001_rawvalue) است که توسط دیگران استفاده می‌شود. اگر می‌خواهید هر فیلد جدید را محاسبه کنید یا داده‌ها را به هر شکلی تبدیل کنید، کار با این نام‌های فیلد در فرمول‌ها و ماکرو بسیار ساده تر خواهد بود؛ زیرا آن‌ها اغلب از یک کنوانسیون نامگذاری استاندارد استفاده می‌کنند. اکنون ردیف بالای مستعارهای توصیفی را حذف می‌کنم اما آن‌ها را در جای دیگر ذخیره می‌کنم.

این جدول شامل سوابق برای ایالات متحده به عنوان یک کل، سوابق برای هر ایالت و سوابق برای هر شهرستان است. این برای داده‌های دولتی رایج است. از آنجا که فقط به عنوان یک مجموعه داده اصلی مستطیل شکل (یا یک پرونده مسطح) به عنوان یک جدول در ArcGIS Online آورده‌ام، اشکالی ندارد. پس از کار با آن، می‌توانم فیلترها را اعمال کنم.

رویMy Content از رایانه کلیک خواهم کرد، اما این بار هیچ کدام را انتخاب می‌کنم، به عنوان جدول اضافه می‌کنم. با ایجاد آیتم، ArcGIS Online را به صفحه جزئیات مورد نظر که در آن گزینه Open in Map Viewer افزودن به نقشه جدید را انتخاب می‌کنم، منتقل می‌کند.

اکنون می‌توانم پرونده‌هایی را که علاقه‌ای به آن ندارم فیلتر کنم. با اضافه کردن جدول به Map Viewer، می‌توانم تأیید کنم که این جدول دارای 3194 رکورد است. به یاد داشته باشید ، جدول دارای پرونده‌هایی برای کل کشور و برای هر ایالت و هر شهرستان است. رکوردهای مربوط به ایالات متحده و ایالت ها مقدار 0 در زمینه‌ای به نام county code دارند. برای اضافه کردن سوابق غیرشهرستان، می‌توانم شمارنده فیلتر 0 را اضافه نکنم و این باعث می‌شود که من به 3142 رکورد دست پیدا کنم.

زیر مجموعه به یک منطقه مورد علاقه

بسیاری از سیاست های بهداشت و آموزش و پرورش در سطح ایالتی تنظیم شده است. تحلیلگران داده که در این زمینه ها کار می‌کنند، نیازی به همکاری با تمام استان‌های کشور، فقط کشورهایی در کشور خود ندارند. به عنوان مثال، اگر من در وزارت بهداشت اوهایو کار می‌کردم، می‌خواهم به رتبه بندی‌های بهداشت استان برای همه شهرستان‌های اوهایو دسترسی داشته باشم. کار با کل مجموعه داده‌های ملی در بهترین حالت حواس پرت کننده خواهد بود. احتمالاً زمان پردازش را کند کرده و اندازه پرونده‌های بزرگتر از حد لازم را ایجاد می‌کند. بهترین روش استفاده از فیلتر برای کار با داده‌های اوهایو خواهد بود.

در برگه Filter، بر روی افزودن عبارت دیگر برای زیر مجموعه حتی بیشتر کلیک می‌کنم و گزینه کشویی بالا را به عنوان ویژگی‌های Display در لایه‌ای که مطابق با همه عبارات زیر است، بگذارم. این دو عبارت کد شهرستان نیست و ارزش OH نیست. این جدول به 88 رکورد می‌‌رسد که تعداد شهرستان های اوهایو است.

از آنجا، روی Add > Browse Living Atlas Layers کلیک کرده و لایه ایالات متحده چند ضلعی‌های شهرستان را به نقشه خود اضافه می‌کنم. یک فیلتر را به لایه‌ای از شهرستان‌ها اعمال می‌کنم به طوری که فقط اوهایو، نه همه ایالات متحده نشان را دهد. این باعث کاهش زمان اجرای عضویت خواهد شد و همچنین تحلیل اعتبار کمتری نیز مصرف می‌کند.

قدم بعدی پیوستن جدول من به مرزهای شهرستان با کلیک کردن بر روی Analysis > Summarize Data > Join Features است. برای پیوستن به لایه هدف، لایه هدف USA Counties و جدول data analytic2019 0 را انتخاب می‌کنم.

با FIPS که مخفف استاندارد پردازش اطلاعات فدرال است، ملحق می‌شوم. کدهای FIPS کدهای گسترده ای برای ایالت‌ها، شهرستان‌ها، بخش‌ها، محدوده‌های ایالتی، مناطق مدارس و بسیاری از سطوح دیگر جغرافیای اداری هستند. یک ویژگی به پیوستن را انجام خواهم داد، بنابراین زمینه‌هایی را انتخاب می‌کنم که مطابقت داشته باشند و مطابق با FIPS به عنوان قسمت هدف باشند تا fipscode را به عنوان قسمت join انتخاب کنند.

در مرحله بعد، یک نام برای لایه جدید خود، رتبه بندی‌های بهداشتی برای اوهایو ایالت 2019 انتخاب می‌کنم. توجه: اگر به همه ایالت‌های ایالات متحده می‌پیوستم، می‌بایست Use Current Map Extent را انتخاب می‌کردم تا در آلاسکا، هاوایی و پورتوریکو حتی اگر در وسعت فعلی نقشه نمایش داده نشوند شامل شوند.

نکات پیوستن

در این جا به بهترین روش‌ها هنگام پیوستن به جداول لایه‌های عارضه، می پردازیم.

هنگام پیوستن به یک شناسه تطبیق مانند FIPS

صفرهای پیشرو را برای ایالت‌هایی با کدهای تک رقمی مانند آلباما (01)، آلاسکا (02)، آریزونا (04)، آرکانزاس (05)، کالیفرنیا (06)، کلرادو (08) و کانکتیکات (09) مشاهده کنید. اغلب این صفرهای اصلی از بین می‌روند؛ زیرا رایانه‌ها به سرعت می‌توانند این زمینه را به عنوان یک زمینه عددی نسبت به زمینه رشته‌ای تشخیص دهند.

هنگام پیوستن به نام

هنگام عضویت در نام منطقه، هم شهرستان و هم ایالتی به آن ملحق شوید. برخلاف کدهای FIPS ، نام شهرستان‌ها در بین ایالت‌ها منحصر به فرد نیست. به عنوان مثال، 26 ایالت وجود دارد که دارای یک شهر فرانکلین است. همچنین، اطمینان حاصل کنید که به طور مداوم از اختصارات حالت یا نام‌های دولت در هر دو لایه هدف و جدول استفاده می‌کنید.

مراقب نام کشور باشید

برخی منابع نام رسمی کشور را به جای نام معمول ذکر می‌کنند («فدراسیون روسیه» در مقابل «روسیه»). به دنبال حروف اختصاری مانند St. Martin در مقابل Saint Martin باشید. تغییرات مداوم در نام کشورها وجود دارد. دو تغییر اخیر کیپ ورد به کابو ورد و مقدونیه در مقدونیه شمالی. کشورهای جدید تمام وقت شکل می‌گیرند. می‌توانم زمانی را قبل از وجود سودان جنوبی به یاد بیاورم.

اجرای پیوستن

بعد، روی Run Analysis کلیک و صبر می‌کنم. بسته به تعداد فیلدها و سوابق در یک جدول، این که جدول به چند ضلعی‌ها (پیچیده ترین)، خطوط یا نقاط (کم تر پیچیده) و جایی که دو مجموعه داده در آن ذخیره شده‌اند، پیوستن می‌تواند چند دقیقه طول بکشد. اگر در حال اجرای پیوستن به لایه‌ای هستید که شما مالک آن نیستید، مانند یک لایه Living Atlas ، ممکن است هشدار «انجام تجزیه و تحلیل با استفاده از لایه های Living Atlas می‌تواند منجر به اجرای زمان بیشتری شود» را مشاهده کنید، چون اتصال را از چندین منبع داده انجام می‌دهید.

اکنون یک لایه جدید در نقشه خود دارم که داده‌های جدولی را به لایه چند ضلعی ملحق می‌کند. می‌توانم آن را نماد سازی کرده و از آن برای پیکربندی پاپ آپ و ایجاد برچسب استفاده کنم. من مطمئن می‌شوم که جزئیات مورد نیاز را برای لایه جدید خود پر کرده ام.

مشاهده متن کامل انگلیسی از اینجا

خلاصه فارسی از : حسن نظری

کد مطلب : 98110901

مشاهده تازه‌های دیگر