<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Iranian Journal of Official Statistics Studies</title>
<title_fa>مجله‌ی بررسی‌های آمار رسمی ایران</title_fa>
<short_title>مجله‌ی بررسی‌ها</short_title>
<subject>Basic Sciences</subject>
<web_url>http://ijoss.srtc.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-5798</journal_id_issn>
<journal_id_issn_online>2538-578x</journal_id_issn_online>
<journal_id_pii>8</journal_id_pii>
<journal_id_doi>7</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>14</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science>13</journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1400</year>
	<month>5</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2021</year>
	<month>8</month>
	<day>1</day>
</pubdate>
<volume>32</volume>
<number>1</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>تحلیل مه‌داده هزینه و درآمد خانوری کشور با بهره‌گیری از سیستم فایل توزیع‌شده هدوپ</title_fa>
	<title>Big Data Analysis of Households Income and Expenditure by Applying Hadoop Distributed File System</title>
	<subject_fa>تخصصي</subject_fa>
	<subject>Special</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;span style=&quot;font-family:Tahoma;&quot;&gt;&lt;span style=&quot;font-size:11pt&quot;&gt;&lt;span style=&quot;background:white&quot;&gt;&lt;span style=&quot;line-height:normal&quot;&gt;&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;مه&#8204;داده از منابع مهم در دنیای امروز است، که&lt;/span&gt;&lt;/span&gt; &lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;با استفاده از تجزیه و تحلیل&#8204;های گوناگونی که روی آن انجام می&#8204;گیرد اطلاعات و دانش ارزشمندی از آن بدست می&#8204;آید&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;.&lt;/span&gt;&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;color:black&quot;&gt; طی دو دهه اخیر حجم این داده&#8204;ها در حال گسترش بوده و رفته رفته بر حجم آن نیز افزوده می&#8204;شود. چارچوب هدوپ برای توزیع و پردازش مه&#8204;داده یکی از پرکاربردترین ابزاری است که با زبان برنامه&#8204;نویسی&lt;/span&gt;&lt;/span&gt; &lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;جاوا نوشته شده است. هدوپ یک ابزار مناسب است که این امکان را می&#8204;دهد تا پردازش بر روی مجموعه داده&#8204;های بزرگ با خوشه&#8204;بندی انجام پذیرد و مدیریت داده&#8204;های نیمه&#8204;ساختاریافته و ساختارنیافته را تسهیل کند.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;font-size:11pt&quot;&gt;&lt;span style=&quot;background:white&quot;&gt;&lt;span style=&quot;line-height:normal&quot;&gt;&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;در ایران نیز همچون کشورهای دیگر هر ساله در حوزه آمارهای رسمی کشور داده&#8204;های خانواری جمع&#8204;آوری می&#8204;شود. این داده&#8204;ها حاوی اطلاعات ارزشمندی است که نتایج آن فقط در سطح کل کشور و استان منتشر می&#8204;شود و تا کنون در سطح شهرستان نتایج و اطلاعاتی استخراج نشده است. هدف این تحقیق استفاده از چارچوب هدوپ برای توزیع و پردازش داده&#8204;های خانواری در سطح شهرستان&#8204;های استان است، سپس اطلاعات استخراج&#8204;شده برای تجزیه و تحلیل مورد استفاده قرارمی&#8204;گیرد.&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span dir=&quot;RTL&quot; lang=&quot;AR-SA&quot; style=&quot;font-size:11.0pt&quot;&gt;&lt;span style=&quot;line-height:107%&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;بر اساس مدل پیشنهادی، خوشه&#8204;بندی داده&#8204;های ۳۱ استان کشور در ۴ خوشه انجام و برای راه&#8204;اندازی ۴ سرور ماشین مجازی با ۴ گره در نظر گرفته شد. داده خام از &lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size:11.0pt&quot;&gt;&lt;span style=&quot;line-height:107%&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;sql به csv تبدیل و در فایل&#8204;های HDFS بارگذاری و عملیات نگاشت/کاهش انجام شد. بر اساس اهداف این تحقیق، خروجی&#8204;های مورد نظر و شاخص&#8204;های برخورداری یک خانوار، مانند استفاده از اینترنت در سطح شهرستان&#8204;های استان ۰۱ استخراج شد و مورد مقایسه و تجزیه و تحلیل قرار گرفت. بدیهی است که همین اطلاعات و شاخص&#8204;ها می&#8204;تواند در سطح وسیع&#8204;تر و در سطح شهرستان&#8204;های دیگر استان&#8204;ها و حتی در سطح روستایی نیز استخراج شده و مورد تجزیه و تحلیل قرار گیرد. با توجه به نتایج این تحقیق پیشنهاد می&#8204;شود، با استفاده از سیستم فایل توزیع&#8204;شده هدوپ، مه&#8204;داده خانواری را سریع&#8204;تر از گذشته آماده کرده و با ارایه بهنگام خروجی&#8204;ها و اطلاعات، تحلیل&#8204;های سریع&#8204;تر و بهتری را نسبت به گذشته انجام داد. همچنین پیشنهاد می&#8204;شود با بکارگیری سیستم توزیع&#8204;شده هدوپ بتوان بین اطلاعات استخراج&#8204;شده سالانه خانواری در سطح شهرستان با اطلاعات سرشماری جمعیتی کشور ارتباط برقرار کرده و خلأی آماری و شاخص&#8204;های برخورداری خانوار را تکمیل کرد.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;b&gt; &lt;/b&gt;&lt;/span&gt;</abstract_fa>
	<abstract>&lt;span style=&quot;font-family:Arial;&quot;&gt;&lt;span style=&quot;font-size:14px;&quot;&gt;&lt;span style=&quot;line-height:normal&quot;&gt;&lt;span lang=&quot;EN&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; times=&quot;&quot;&gt;Big data is one of the most important resources in today&amp;#39;s world, from which valuable information and knowledge is obtained by using various analyzes that are performed on it. Over the last two decades, the volume of this data has been expanding and its volume is gradually increasing. The Hadoop framework for distributing and processing metadata is one of the most widely used tools written in the Java programming language. Hadoop is a convenient tool that allows the processing of large data sets with clustering and facilitates the management of semi-structured and unstructured data.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size:11pt&quot;&gt;&lt;span style=&quot;line-height:normal&quot;&gt;&lt;span style=&quot;tab-stops:45.8pt 91.6pt 137.4pt 183.2pt 229.0pt 274.8pt 320.6pt 366.4pt 412.2pt 458.0pt 503.8pt 549.6pt 595.4pt 641.2pt 687.0pt 732.8pt&quot;&gt;&lt;span style=&quot;font-family:Calibri,sans-serif&quot;&gt;&lt;span style=&quot;font-size:12.0pt&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;
&lt;pre style=&quot;text-align:justify&quot;&gt;
&lt;/pre&gt;

&lt;pre style=&quot;text-align:justify&quot;&gt;
&lt;/pre&gt;

&lt;pre style=&quot;text-align:justify&quot;&gt;
&lt;/pre&gt;

&lt;pre style=&quot;text-align:justify&quot;&gt;
&lt;/pre&gt;

&lt;pre style=&quot;text-align:justify&quot;&gt;
&lt;/pre&gt;

&lt;pre style=&quot;text-align:justify&quot;&gt;
&lt;/pre&gt;

&lt;pre style=&quot;text-align:justify&quot;&gt;
&lt;span style=&quot;font-size:14px;&quot;&gt;&lt;span style=&quot;font-family:Tahoma;&quot;&gt;&lt;span style=&quot;font-family:Arial;&quot;&gt;&lt;span style=&quot;font-family:Tahoma;&quot;&gt;&lt;span courier=&quot;&quot; new=&quot;&quot;&gt;&lt;span lang=&quot;EN&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; times=&quot;&quot;&gt;In Iran, as in other countries, Household data is collected every year in the field of official statistics. These data contain valuable information, the results of which are published only in the whole country and province, and so far no results and information have been extracted in the city. &lt;/span&gt;&lt;/span&gt;&lt;span lang=&quot;EN&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; times=&quot;&quot;&gt;The purpose of this study is to use the Hadoop framework for the distribution and processing of household data in the cities of the province, then the extracted information is used for analysis.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span courier=&quot;&quot; new=&quot;&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/pre&gt;
&lt;span style=&quot;font-size:14px;&quot;&gt;&lt;span style=&quot;font-family:Tahoma;&quot;&gt;&lt;span style=&quot;font-family:Arial;&quot;&gt; &lt;span style=&quot;line-height:normal&quot;&gt;&lt;span lang=&quot;EN&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; times=&quot;&quot;&gt;Based on the proposed model, data clustering of 31 provinces of the country was done in 4 clusters and 4 virtual machine servers with 4 nodes were considered. The raw data was converted from sql to csv and uploaded into HDFS files and then Map/Reduce operations were performed. Therefore, based on the objectives of this research, the outputs such as the average communication expenditure of a household and the Internet indicator at the level of the cities of 01 province were extracted and the comparisons were also shown.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;line-height:normal&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;

&lt;pre style=&quot;text-align:justify&quot;&gt;
&lt;span style=&quot;font-size:14px;&quot;&gt;&lt;span style=&quot;font-family:Tahoma;&quot;&gt;&lt;span style=&quot;font-family:Arial;&quot;&gt;&lt;span courier=&quot;&quot; new=&quot;&quot;&gt;&lt;span lang=&quot;EN&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; times=&quot;&quot;&gt;It is obvious that the same information and indicators can be extracted and analyzed at a wider level, at the level of other cities of other provinces and even at the village level. According to the results of this research, it is suggested that by using the Hadoop distributed file system, household data can be prepared faster than in the past, which is now collected centrally, offline and with a delay. By providing timely outputs and information, faster and better analyzes can be performed than in the past. It is also suggested that by using the Hadoop distributed system, it will be possible to establish a relationship between the extracted annual household information at the city level with the population census information of the country and fill the statistical gap and household access indicators.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/pre&gt;

&lt;pre style=&quot;text-align:justify&quot;&gt;
&lt;/pre&gt;</abstract>
	<keyword_fa>چارچوب هدوپ, سیستم فایل توزیع‌شده, نگاشت کاهش, مه‌داده, داده‌های خانواری.</keyword_fa>
	<keyword>Hadoop framework, Hadoop Distributed File System, MapReduce, Big Data, Household Data.</keyword>
	<start_page>97</start_page>
	<end_page>123</end_page>
	<web_url>http://ijoss.srtc.ac.ir/browse.php?a_code=A-10-341-2&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Reza</first_name>
	<middle_name></middle_name>
	<last_name>Alipour</last_name>
	<suffix></suffix>
	<first_name_fa>رضا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>علیپور</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>rezaalipour955@gmail.com</email>
	<code>10031947532846001603</code>
	<orcid>10031947532846001603</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Iran University of Science and Technology</affiliation>
	<affiliation_fa></affiliation_fa>
	 </author>


	<author>
	<first_name>Reza</first_name>
	<middle_name></middle_name>
	<last_name>Entezari Maleki</last_name>
	<suffix></suffix>
	<first_name_fa>رضا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>انتظاری ملکی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>entezari@iust.ac.ir</email>
	<code>10031947532846001604</code>
	<orcid>10031947532846001604</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Iran University of Science and Technology</affiliation>
	<affiliation_fa></affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
