本技术实施例公开了一种文本分析的方法及系统,包括:获取一定数量的政策文本,对政策文本进行预处理,得到预处理数据;将预处理数据输入自适应模型进行训练,以得到最优自适应模型;通过输入层接收预处理数据,通过多层次划分层对预处理数据进行划分处理,得到划分数据,通过嵌入表示层将划分数据映射到低维向量空间以获取划分数据的嵌入向量,通过主题建模层对嵌入向量进行主题分类,通过输出层对主题分类后的嵌入向量进行结构化解读输出政策文本对应政策关系的结构化数据;将待分析政策文本输入至最优自适应模型,得到待分析政策文本对应政策关系的结构化数据。解决现有技术中无法对产业政策深入、全面和精准分析的问题。
背景技术
随着全球数字化转型进程的加速,信息技术在各个行业的渗透持续加深,新兴产业蓬勃发展,各个行业的技术发展动态、市场需求变化以及政策扶持状况对于产业发展路径的预测和支持政策的制定有着至关重要的作用。尤其在国际竞争愈发激烈的全球环境中,合理的政策引导与有效的市场支持机制是提升产业创新能力和国际竞争力的关键要素,这使得构建支持产业发展战略的数字化平台成为当务之急,而其中产业政策数据库的建立完善更是重中之重。
当前,产业政策数据主要来源于多种渠道,包括各类政策文件、行业报告以及政府规划文件等。然而,现阶段产业政策分析方法存在诸多局限性,严重影响了对政策内涵的全面理解和有效利用。
在现有产业政策分析实践中,传统方法主要基于基本的文本检索技术,例如关键词匹配和简单的文本分类。
这些方法在处理政策文件时存在明显不足;首先,在跨文件分析方面,现有技术多聚焦于单个政策文件内容,缺乏对不同政策文件间内在联系的系统性对比能力。这导致无法追踪和剖析政策的演变脉络,难以从宏观视角把握政策发展的连贯性;其次,从分析维度来看,传统方法局限于词汇层面的相似度分析。这种方式忽略了政策内容所蕴含的更为复杂的关联以及潜在的战略意图,使得分析结果过于浅显,无法深入挖掘政策的深层含义;再者,在政策关联性判定上,现有技术精度欠佳。特别是在复杂的政策环境中,由于难以捕捉不同政策文件之间深层次的关联,细微的政策差异容易被忽略,进而影响对政策整体影响的准确评估。最后,面对大规模的文献数据,由于现有的分析方法效率较低,在处理海量政策文件和文本数据时表现吃力,无法实现精准且高效的分析,从而限制了对大规模产业政策数据的有效利用。
综上所述,传统产业政策分析方法已无法满足当前产业发展对政策分析的需求,亟需一种新的、更为有效的政策分析方法,以克服现有技术的局限性,实现对产业政策更深入、全面和精准的分析。
实现思路