平面媒体语言分中心

 

国家语言资源监测与研究中心是为了推动建立并逐步形成一种对社会语言生活进行实时监测和规范引导的长效机制,这项工作作为系统工程已列入教育部第二轮教育振兴行动计划,其研究成果可作为国家语言文字方针政策、语言文字标准、规范制定和调整的参考,也可为群众正确使用祖国语言文字提供咨询服务,从而更积极有效地促进和引导社会语言生活健康发展。

 

平面媒体分中心于2004年6月30日正式成立,是最早成立的一个分中心。目前在资源建设、管理、使用、研究上正在有步骤的推进。

 

分中心组织

 

中心的组织结构如图所示 

 

目前分中心的研究人员包括:博导1人、教授2人、副教授1人,博士研究生5人,硕士研究生9人。

 

资源建设

 

自2002年起,我们对北京青年报、北京日报、北京晚报、法制日报、光明日报、广州日报、环球时报、经济日报、今晚报、南方周末、钱江晚报、人民日报、深圳特区报、新民晚报、羊城晚报、扬子晚报、中国青年报等报纸的网络版的内容进行下载,作为监测与研究的原始数据。目前,已收集到的数据情况如下:

2002年:总文本数:602,534个,总字数:545,784,375字。

2003年:总文本数:562,669个,总字数:426,805,177字。

2004年:总文本数:573,365个,总字数:438,805,362字。

2005年:总文本数:591,315个,总字数:538,772,521字。

2006年:总文本数:648,607个,总字数:471,860,752字。