2026/2/11 15:18:16
网站建设
项目流程
如何做网站新手个人教程,成都广告公司招聘,多用户商城系统哪个公司的好,请专业公司做个网站要花多少钱FarsNews 1402年首六个月新闻数据集
引言与背景
FarsNews 1402年首六个月新闻数据集是一个包含102,564条波斯语新闻记录的综合性数据集#xff0c;涵盖了伊朗法尔斯通讯社在1402年#xff08;即2023年#xff09;前六个月发布的全部新闻内容。该数据集不仅包含完整的新闻文…FarsNews 1402年首六个月新闻数据集引言与背景FarsNews 1402年首六个月新闻数据集是一个包含102,564条波斯语新闻记录的综合性数据集涵盖了伊朗法尔斯通讯社在1402年即2023年前六个月发布的全部新闻内容。该数据集不仅包含完整的新闻文本内容还提供了丰富的元数据信息包括新闻标题、摘要、情感标注、分类标签、作者信息、发布时间、互动数据等。数据集覆盖了政治、经济、体育、社会、文化、国际等多个领域是波斯语自然语言处理、情感分析、新闻分类、话题建模等研究任务的宝贵资源。该数据集的完整性和多样性使其成为训练和评估波斯语文本理解模型的理想数据源同时对于研究伊朗社会动态、舆论趋势、媒体传播等具有重要价值。数据基本信息字段说明字段名称字段类型字段含义数据示例完整性news_id字符串新闻唯一标识符“1679378637000825502”100.00%author_id字符串作者标识符“Provinces”100.00%author_name字符串作者名称“استان ها”100.00%title字符串新闻标题“افزایش فوتیهای تصادفات جادهای در مازندران”100.00%abstract字符串新闻摘要“استاندار مازندران از افزایش فوتیهای تصادفات جادهای در مازندران خبر داد”100.00%sentiment分类情感标注“منفی”100.00%hashtags数组标签列表[“ترافیک”, “مازندران”, “تصادفات_جادهای”]96.92%category分类新闻分类“Provinces”100.00%subcategories数组子分类列表[“mazandaran”]91.31%view_count数值浏览量“7”100.00%comment_count数值评论数“1”100.00%repost_count数值转发数“1”100.00%publication_year数值发布年份1402100.00%publication_month数值发布月份1100.00%publication_month_name字符串月份名称“فروردین”100.00%publication_day数值发布日期1100.00%publication_time字符串发布时间“09:33”100.00%news_text字符串完整新闻文本“افزایش فوتیهای تصادفات جادهای در مازندران…”100.00%url字符串新闻链接“https://farsnews.ir/Provinces/…”100.00%情感分析分布情感类型记录数量占比خنثی43,48142.39%مثبت32,66031.84%منفی24,88324.26%未标注1,5211.48%其他160.02%新闻分类分布分类名称记录数量占比Provinces (省份)47,06045.88%Sports (体育)8,9978.77%world (国际)8,7308.51%social (社会)5,6365.50%economy (经济)4,4054.29%politics (政治)3,9623.86%Fars_plus (法尔斯)3,0813.00%culture (文化)2,9672.89%University (大学)2,1192.07%Photo (图片)1,5391.50%ArtsandMedia (艺术与媒体)1,1991.17%ScientificAcademic (科学与学术)1,1271.10%其他分类8,6438.43%子分类分布Top 20子分类名称记录数量占比ForeignPolicy_World (外交政策)5,3615.23%Football_Iran_Sports (伊朗足球)3,2353.15%WestAsia_World (西亚)2,9062.83%Others_Sports (其他体育)2,6782.61%provincefars (法尔斯省)2,6342.57%mazandaran (马赞德兰省)2,6332.57%Football_World_Sports (世界足球)2,5602.50%hormozgan (霍尔木兹甘省)2,4722.41%isfahan (伊斯法罕省)2,3682.31%tehran (德黑兰)2,2342.18%azerbaijan_sharghi (东阿塞拜疆省)2,1912.14%khuzestan (胡齐斯坦省)2,0932.04%Kohgiluyeh_Boyerahmad (科吉卢耶-博耶尔艾哈迈德省)2,0522.00%razavi (拉扎维省)1,8801.83%khorasan_jonubi (南霍拉桑省)1,8051.76%provinceilam (伊拉姆省)1,6991.66%semnan (塞姆南省)1,6451.60%provinceqom (库姆省)1,6291.59%zanjan (赞詹省)1,6271.59%alborz (阿尔博尔兹省)1,5731.53%月份分布月份记录数量占比فروردین (3月)14,84414.47%اردیبهشت (4月)17,65117.21%خرداد (5月)17,79917.35%تیر (6月)17,92917.48%مرداد (7月)17,48117.04%شهریور (8月)16,42016.01%主要作者分布Top 20作者名称记录数量占比استان ها (省份)47,13445.96%ورزشی (体育)9,6879.44%بین الملل (国际)7,3487.16%جامعه (社会)5,6975.55%سیاسی (政治)4,3114.20%اقتصادی (经济)4,0413.94%فرهنگ (文化)2,8902.82%خبرگزاری فارس (法尔斯通讯社)2,5252.46%منتخب رسانهها (媒体精选)2,5142.45%دانشگاه (大学)2,2832.23%عکس (图片)1,7121.67%هنر و رسانه (艺术与媒体)1,1951.17%علم و پیشرفت (科学与进步)1,1381.11%سیاست خارجی (外交政策)9770.95%باشگاه خبرنگاران توانا (塔瓦纳记者俱乐部)9420.92%بازار (市场)6880.67%زندگی (生活)6760.66%فارس پلاس (法尔斯)4220.41%استان فارس (法尔斯省)3690.36%标签分布Top 30标签名称记录数量占比ایران (伊朗)5,2955.16%تهران (德黑兰)2,6622.60%آمریکا (美国)2,5452.48%اربعین (阿尔拜恩)2,4072.35%روسیه (俄罗斯)2,2362.18%فوتبال (足球)2,0101.96%مازندران (马赞德兰)1,5831.54%مجلس (议会)1,5831.54%تولید (生产)1,5471.51%فارس (法尔斯)1,5361.50%اوکراین (乌克兰)1,4761.44%اصفهان (伊斯法罕)1,4671.43%انتخابات (选举)1,3341.30%زائران (朝圣者)1,3291.30%دولت (政府)1,3131.28%استقلال (独立)1,2821.25%هرمزگان (霍尔木兹甘)1,2781.25%پرسپولیس (波斯波利斯)1,2701.24%دانشگاه (大学)1,2581.23%زنجان (赞詹)1,2391.21%حجاب (头巾)1,2011.17%شهید (烈士)1,1991.17%اقتصاد (经济)1,1631.13%ایلام (伊拉姆)1,1371.11%کشاورزی (农业)1,1311.10%هواشناسی (气象)1,1271.10%گردشگری (旅游)1,0781.05%خراسان_جنوبی (南霍拉桑)1,0551.03%فلسطین (巴勒斯坦)1,0441.02%پلیس (警察)1,0321.01%互动数据统计浏览量最小值1最大值9,852平均值47.42评论数最小值1最大值4平均值1.00转发数最小值1最大值9平均值1.86数据优势优势特征具体表现应用价值完整新闻文本每条记录都包含完整的新闻正文内容而非仅标题或摘要支持深度文本分析、语义理解、长文本建模等任务高质量情感标注98.52%的记录包含情感标注正向、负向、中性可直接用于情感分析模型训练和评估多层次分类体系包含主分类和子分类覆盖政治、经济、体育、社会等17个主要领域支持多分类任务、领域自适应研究、跨领域对比分析丰富元数据包含作者、发布时间、标签、互动数据等17个字段支持时间序列分析、作者风格研究、传播效果分析地理覆盖全面子分类涵盖伊朗31个省份中的大部分地区支持地域性话题分析、区域舆情监测、地理信息关联研究时间连续性涵盖1402年首六个月的完整时间序列支持趋势分析、事件追踪、时间序列预测标签系统完善96.92%的记录包含标签标签总数超过3,000个支持话题建模、关键词提取、标签推荐系统互动数据完整包含浏览量、评论数、转发数等社交媒体指标支持传播效果分析、热门新闻预测、用户行为研究数据规模适中102,564条记录适合训练中小规模模型平衡了模型训练需求与计算资源消耗原始URL保留每条记录包含原始URL链接支持数据溯源、内容验证、扩展信息获取数据来源https://dianshudata.com/dataDetail/14425数据样例由于数据集包含完整的波斯语新闻文本内容以下展示20条具有代表性的元数据样例这些样例涵盖了不同的分类、情感类型、时间段和地区展示了数据集的多样性特征。样例1新闻ID1679378637000825502标题افزایش فوتیهای تصادفات جادهای در مازندران/ برگزاری روزانه جلسات شورای ترافیک摘要استاندار مازندران از افزایش فوتیهای تصادفات جادهای در مازندران خبر داد و خواستار گفتمانسازی جادهای شد情感منفی分类Provinces子分类mazandaran标签ترافیک، مازندران، تصادفات_جادهای作者استان ها发布时间1402/1/1 09:33浏览/评论/转发7/1/1样例2新闻ID1679378716000132914标题شب نشینی در اردوگاه شهید بلباسی خرمشهر با حضور فرمانده سپاه کربلا/مناطق عملیاتی تحول آفرین است摘要فرمانده سپاه کربلا در اردوگاه شهید بلباسی خرمشهر گفت: مناطق عملیاتی تحول آفرین است情感مثبت分类Provinces子分类khuzestan, mazandaran标签سپاه_کربلا، راهیان_نور، مناطق_عملیاتی، شهید_بلباسی作者استان ها发布时间1402/1/1 09:35浏览/评论/转发23/1/1样例3新闻ID1679378970000844033标题پیام تبریک رییس دانشگاه تربیت مدرس به مناسبت فرارسیدن سال نو摘要رییس دانشگاه تربیت مدرس در پیامی فرا رسیدن عید نوروز و بهار قرآن را به تمامی دانشگاهیان تبریک گفت情感مثبت分类University子分类无标签دانشگاه_تربیت_مدرس، نوروز، بهار_قرآن作者دانشگاه发布时间1402/1/1 09:39浏览/评论/转发30/1/4样例4新闻ID1679379337000718746标题تمهید بسترهای شادی و رفاه مسافران نوروزی در مازندران摘要معاون استاندار مازندران از تمهید بسترهای شادی و رفاه مسافران نوروزی در مازندران خبر داد情感مثبت分类Provinces子分类mazandaran标签مازندران، مسافران_نوروزی، نوروزخوانی، امیری_خوانی، کشتی_لوچو作者استان ها发布时间1402/1/1 09:45浏览/评论/转发16/1/1样例5新闻ID1679379346000334996标题تحویل سال در گلزار شهدای بهبهان摘要در مراسم لحظه تحویل سال تعداد زیادی از مردم شهرستان بهبهان و خانواده شهدا با حضور در جوار قبور متبرک情感خنثی分类Provinces子分类khuzestan标签تحویل_سال، گلزار_شهدا، بهبهان作者خوزستان发布时间1402/1/1 09:45浏览/评论/转发34/1/1样例6新闻ID1679379359000144806标题پیام تبریک نوروز نخستوزیر ارمنستان به ایران摘要نخستوزیر ارمنستان در پیامی فرا رسیدن عید نوروز را به رهبر معظم انقلاب و رئیسجمهور ایران تبریک گفت情感مثبت分类world子分类ForeignPolicy_World标签نوروز، تبریک، ارمنستان، ایران作者بین الملل发布时间1402/1/1 09:45浏览/评论/转发2/1/3样例7新闻ID1679379715000897180标题نودشه، زیباترین شهر پلکانی کرمانشاه با بیشینه کلاش بافی/ پاپوشی که لنگه راست و چپ ندارد摘要شهر نودشه، زیباترین شهر پلکانی کرمانشاه با بیشینه کلاش بافی است و مهمانان نوروزی استان کرمانشاه لذت情感مثبت分类Provinces子分类kermanshah标签نودشه، شهر_پلکانی، کرمانشاه، کلاش_بافی作者استان ها发布时间1402/1/1 09:51浏览/评论/转发13/1/2样例8新闻ID1679379737000770015标题امباپه کاپیتان تیم ملی فرانسه شد摘要کیلیان امباپه به عنوان کاپیتان جدید تیم ملی فرانسه انتخاب شد情感خنثی分类Sports子分类Football_World_Sports标签امباپه، تیم_ملی_فرانسه، کاپیتان作者ورزشی发布时间1402/1/1 09:52浏览/评论/转发3/1/3样例9新闻ID1679379756000556196标题شورای شهر قم بودجه سال ۱۴۰۲ را تصویب کرد摘要شورای اسلامی شهر قم در نود و هفتمین جلسه رسمی خود بودجه سال ۱۴۰۲ شهرداری قم را تصویب کرد情感خنثی分类Provinces子分类provinceqom标签شورای_شهر، قم، بودجه، سال۱۴۰۲作者استان ها发布时间1402/1/1 09:52浏览/评论/转发8/1/1样例10新闻ID1679379766000684755标题تسلیت وزیر ورزش به مناسبت شهادت سردار حاجی زاده摘要وزیر ورزش و جوانان در پیامی شهادت سردار حاجی زاده را تسلیت گفت情感منفی分类Sports子分类Others_Sports标签وزیر_ورزش، شهادت، سردار_حاجی_زاده، تسلیت作者ورزشی发布时间1402/1/1 09:52浏览/评论/转发4/1/1样例11新闻ID1679379808000595270标题تحویل سال در حرم مطهر رضوی摘要مراسم تحویل سال ۱۴۰۲ در حرم مطهر رضوی با حضور مسئولان و زائران برگزار شد情感خنثی分类Provinces子分类razavi标签تحویل_سال، حرم_رضوی، مشهد، زائران作者استان ها发布时间1402/1/1 09:53浏览/评论/转发31/1/3样例12新闻ID1679379826000186956标题افزایش نرخ بلیت حمل و نقل عمومی در خراسان شمالی摘要مدیرعامل سازمان حمل و نقل شهرداری بجنورد از افزایش نرخ بلیت حمل و نقل عمومی خبر داد情感منفی分类Provinces子分类khorasan_shomali标签حمل_و_نقل_عمومی، بلیت، خراسان_شمالی作者استان ها发布时间1402/1/1 09:54浏览/评论/转发4/1/1样例13新闻ID1679377480000018087标题کنعانی: دشمنی با نظام جمهوری اسلامی و ملت ایران، بخش ثابت سیاست خارجی رژیم آمریکاست摘要سخنگوی وزارت امور خارجه گفت: دشمنی با نظام جمهوری اسلامی و ملت ایران، بخش ثابت سیاست خارجی رژیم آمریکا情感منفی分类world子分类ForeignPolicy_World标签کنعانی، دشمنی، ایران، آمریکا، نوروز作者سیاست خارجی发布时间1402/1/1 09:14浏览/评论/转发5/1/3样例14新闻ID1679377700000088061标题ثبت یک فوتی کرونایی در مازندران摘要تعداد بستریشدگان کرونایی در مازندران افزایش یافت و یک مورد فوتی نیز ثبت شد情感منفی分类Provinces子分类mazandaran标签کرونا، مازندران، فوتی، پروتکل_بهداشتی作者استان ها发布时间1402/1/1 09:18浏览/评论/转发41/1/1样例15新闻ID1679377757000743015标题زیرساختهای بهداشتی برای مسافران نوروزی بوشهر مهیا شد摘要زیرساختهای بهداشتی برای مسافران نوروزی بوشهر مهیا شد. ۲۲۰۰ چشمه سرویس بهداشتی توسط شهرداریها ایجاد情感مثبت分类Provinces子分类bushehr标签بوشهر، مسافران_نوروزی، بهداشت، سرویس_بهداشتی作者استان ها发布时间1402/1/1 09:19浏览/评论/转发38/1/1样例16新闻ID1679378041000682429标题فارسمن| عملیات لکهگیری در محور هراز تداوم دارد摘要تداوم عملیات لکهگیری در محور هراز برای رفع چالهها در ایام نوروز به منظور ایمنی مسافران و خودروها情感خنثی分类Provinces子分类mazandaran标签هراز، چالههای، جاده، نوروز作者استان ها发布时间1402/1/1 09:24浏览/评论/转发19/1/3样例17新闻ID1679378172000262106标题سال نو و اقدامات نو؛ ادامه فعالیتها در زمینه رشد تولید در دانشگاهها摘要تاکید بر ادامه فعالیت دانشگاهها در زمینه رشد تولید دانشبنیان و نقش آنها در تحقق شعار سال ۱۴۰۲情感مثبت分类University子分类Research_University标签دانشگاهها، رشد، تولید، دانشبنیان، تحقق، فرمان، سال1402作者دانشگاه发布时间1402/1/1 09:26浏览/评论/转发4/1/2样例18新闻ID1679378244000705369标题۴۰۰هزار تن برنج پرمحصول در انبارهای مازندران ماند摘要ماندن 400 هزار تن برنج پرمحصول در انبارهای مازندران به دلیل واردات بیش از نیاز دولت情感منفی分类Provinces子分类mazandaran标签برنج، مازندران، واردات، تولیدکننده作者استان ها发布时间1402/1/1 09:27浏览/评论/转发15/1/1样例19新闻ID1679378263000779402标题وام مسکن در گرو وامهای غیرضروری و خودمانی摘要لزوم تخصیص تسهیلات بیشتر به ساخت مسکن و کاهش تسهیلات غیرضروری توسط بانکها برای ساخت مسکن بدون ایجاد情感منفی分类Fars_plus子分类Wire_Plus标签标签وام، مسکن، تسهیلات، بانکها، تورم作者منتخب رسانهها发布时间1402/1/1 09:27浏览/评论/转发32/1/3样例20新闻ID1679378386000699146标题تحویل سال نو همراه شقایقها摘要برگزاری مراسم تحویل سال ۱۴۰۲ در گلزار شهدای وادی رحمت تبریز با حضور مردم و خانواده شهدا情感خنثی分类Photo子分类无标签تحویل، سال، گلزار، شهدا، وادی، رحمت، تبریز作者عکس发布时间1402/1/1 09:29浏览/评论/转发23/1/3应用场景波斯语情感分析模型训练与评估该数据集包含102,564条带有情感标注的波斯语新闻记录其中98.52%的记录包含明确的情感标签正向、负向、中性为波斯语情感分析模型的训练和评估提供了高质量的数据基础。研究者可以利用该数据集训练基于深度学习的情感分类模型如BERT、RoBERTa等预训练模型的波斯语版本或者构建传统的机器学习模型如SVM、随机森林等。数据集中的完整新闻文本使得模型能够学习到更丰富的语义信息和上下文特征而不仅仅是标题或摘要。此外数据集还包含少量其他情感类型如担忧、警告、悲伤等为细粒度情感分析提供了可能。通过在训练集、验证集和测试集上合理划分数据研究者可以全面评估模型的性能包括准确率、精确率、召回率、F1值等指标。该数据集还可以用于迁移学习研究将在该数据集上训练的模型应用到其他波斯语文本领域如社交媒体评论、产品评价等。波斯语新闻分类与主题识别数据集包含17个主要分类和数百个子分类涵盖了政治、经济、体育、社会、文化、国际等多个领域为波斯语新闻分类和主题识别任务提供了丰富的标注数据。研究者可以利用该数据集训练多分类模型自动将新闻归类到预定义的类别中或者使用无监督学习方法如LDA主题模型、K-means聚类等发现潜在的主题结构。由于数据集包含完整的新闻文本模型可以基于更全面的内容进行分类而非仅依赖标题或关键词。此外子分类信息为层次化分类提供了可能研究者可以构建层次分类模型先进行粗粒度分类再进行细粒度分类。该数据集还可以用于领域自适应研究研究模型在不同领域之间的泛化能力或者构建领域特定的分类器。在实际应用中训练好的新闻分类系统可以用于新闻门户的内容组织、个性化推荐、舆情监测等场景。波斯语自然语言处理基础研究作为一个大规模的波斯语新闻语料库该数据集为波斯语自然语言处理的各项基础研究提供了宝贵资源。研究者可以利用该数据集进行波斯语词法分析、句法分析、语义分析等研究构建波斯语的词汇表、词向量、语言模型等基础工具。数据集中的完整文本使得研究者可以研究波斯语的文本特征如词频分布、词长分布、句子长度分布等或者进行命名实体识别、关系抽取、事件抽取等任务。由于数据集来自真实的新闻媒体其语言风格和表达方式具有代表性能够反映波斯语在正式场合的使用特点。此外数据集中的标签系统为关键词提取、标签推荐、话题建模等任务提供了标注数据。研究者还可以利用该数据集构建波斯语的预训练语言模型如BERT、GPT等为下游任务提供强大的语义表示能力。这些基础研究成果将推动波斯语自然语言处理技术的发展为其他应用提供技术支撑。时间序列分析与事件追踪数据集涵盖了1402年首六个月的完整时间序列包含精确的发布时间信息年、月、日、时为时间序列分析和事件追踪提供了理想的数据基础。研究者可以分析不同时间段内的新闻数量变化、情感倾向变化、话题热度变化等趋势识别重要事件的时间节点和持续时间。例如可以分析诺鲁兹节波斯新年期间的新闻特征从样例中可以看到大量与诺鲁兹相关的新闻集中在3月法尔丁月。通过时间序列分析研究者可以构建新闻热度预测模型预测未来时间段内可能的热点话题或者构建事件检测模型自动识别突发新闻事件。此外数据集中的互动数据浏览量、评论数、转发数可以用于研究新闻传播的时间特征如传播速度、传播范围等。这些研究对于媒体监测、舆情预警、事件响应等应用具有重要价值。地域性话题分析与区域舆情监测数据集的子分类涵盖了伊朗31个省份中的大部分地区为地域性话题分析和区域舆情监测提供了丰富的数据。研究者可以分析不同省份的新闻主题分布、情感倾向、关注度等特征识别地区性的热点话题和舆情趋势。例如从数据统计可以看到马赞德兰省、法尔斯省、霍尔木兹甘省等地区的新闻数量较多可能是这些地区在数据集覆盖期间发生了较多重要事件。通过地域性分析研究者可以构建区域舆情监测系统实时监控不同地区的舆论动态及时发现潜在的舆情风险。此外可以研究跨地区的话题传播分析某个话题在不同地区的传播路径和影响力差异。这些研究对于政府决策、区域发展规划、危机管理等应用具有重要参考价值。在实际应用中地域性舆情监测系统可以帮助地方政府了解民意、评估政策效果、及时发现和应对社会问题。新闻传播效果分析与用户行为研究数据集包含浏览量、评论数、转发数等社交媒体互动数据为新闻传播效果分析和用户行为研究提供了量化指标。研究者可以分析不同类型新闻的传播特征如情感倾向与传播效果的关系、话题类型与传播效果的关系、发布时间与传播效果的关系等。例如可以研究负面新闻是否比正面新闻更容易传播或者体育新闻是否比政治新闻获得更多的互动。通过统计分析研究者可以构建新闻热度预测模型预测某条新闻可能获得的浏览量、评论数、转发数为新闻编辑提供参考。此外可以研究用户评论的情感特征分析用户对不同类型新闻的反应模式。这些研究对于媒体运营、内容推荐、广告投放等应用具有重要价值。在实际应用中传播效果分析可以帮助媒体优化内容策略提高用户参与度和影响力。跨语言信息检索与多语言对比研究作为一个波斯语新闻数据集该数据集可以用于跨语言信息检索和多语言对比研究。研究者可以将该数据集与其他语言的新闻数据集进行对比研究不同语言媒体在报道同一事件时的差异如报道角度、情感倾向、关键词使用等。例如可以对比波斯语媒体和英语媒体对伊朗相关事件的报道差异或者对比不同语言媒体对国际事件的报道重点。通过跨语言分析研究者可以构建多语言信息检索系统支持用户用一种语言查询多种语言的新闻内容。此外可以研究机器翻译在新闻领域的应用评估波斯语与其他语言之间的翻译质量。这些研究对于国际舆情监测、跨文化交流、多语言内容聚合等应用具有重要价值。在实际应用中跨语言信息检索系统可以帮助用户获取多角度的新闻信息促进信息共享和理解。结尾FarsNews 1402年首六个月新闻数据集是一个包含102,564条波斯语新闻记录的高质量数据集具有完整新闻文本、高质量情感标注、多层次分类体系、丰富元数据等核心优势。该数据集覆盖政治、经济、体育、社会、文化、国际等多个领域涵盖伊朗大部分地区时间跨度完整为波斯语自然语言处理研究提供了宝贵资源。数据集的完整性和多样性使其适用于情感分析、新闻分类、主题识别、时间序列分析、地域性分析、传播效果分析等多种应用场景对于推动波斯语自然语言处理技术的发展、促进伊朗社会动态研究、支持媒体监测和舆情分析等具有重要价值。研究者可以利用该数据集训练和评估各种波斯语文本理解模型或者进行跨语言对比研究为多语言信息检索和国际舆情监测提供支持。该数据集的开放使用将促进波斯语自然语言处理研究的发展为相关应用提供数据基础和技术支撑。有需要可私信获取更多信息。