Sensitive-lexicon一个持续更新的中文敏感词库,旨在帮助开发者和内容审核者快速识别并过滤不当文本。
一个持续更新的中文敏感词库,旨在帮助开发者和内容审核者快速识别并过滤不当文本。它提供了一份广泛覆盖政治、色情、暴力等敏感领域的词汇列表,方便快速嵌入任何文本审核流程,并通过社区协作保持长期更新。
Github地址
https://github.com/konsheng/Sensitive-lexicon

功能特点
• 广泛覆盖:涵盖数万条词汇,覆盖主流敏感领域,能够满足多种文本审核场景的需求。 • 持续更新:根据社会语境的变化定期更新,保持时效性与准确性,确保词库始终符合当下环境的需求。 • 易于集成:采用纯文本格式,可在任意语言/框架中直接引用,方便开发者快速将其集成到自己的项目中。 • 社区驱动:欢迎用户通过Issue或PR参与贡献,携手打造更完整的词库,借助社区的力量不断完善内容。
目录结构
Sensitive-lexicon/ ├── ThirdPartyCompatibleFormats/ # 用于第三方格式 ├── Vocabulary/ # 词汇库 ├── LICENSE # 许可证 └── README.md # 项目说明
• ThirdPartyCompatibleFormats:存放用于第三方格式的文件,方便与其他工具或平台进行适配。 • Vocabulary:存放词汇库文件,这是项目的核心部分,包含各种敏感词汇。 • LICENSE:项目的许可证文件,说明了使用该项目的法律条款。 • README.md:项目的说明文件,介绍了项目的基本信息、使用方法等内容。
[广告]赞助链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注KnowSafe微信公众号随时掌握互联网精彩
- 微软在Windows 11右键菜单中新增询问Copilot按钮可以调用AI查内容
- EasyPR一款高效准确的中文开源车牌识别系统
- 腾讯回应微信自动清理3天未读消息:未接收会清理
- 卓驭科技与高通宣布基于Snapdragon Ride平台推出成行平台全新智能驾驶解决方案
- 在Z|微步在线(北上广深等多省市)诚招大客户销售经理、行业leader、区域leader
- 端侧 AI 开发难?揭秘 HUAWEI HiAI Foundation 助力快速部署 AI 应用的「超能力」
- 腾讯总裁刘炽平回应组织优化传闻;美国软件工程师平均薪水最高;GIF动图发明人去世|极客头条
- 2个维度5大方法,让你的微服务在K8s上跑起来
- 华为拿百亿资金给员工分红,每股1.58元;苹果将推出M2芯片入门级MacBook Pro;Flutter 2.10发布|极客头条
- 雷军吐槽友商“PPT首发”,联想高管反击;iPhone 6 Plus成过时产品;IPython 7.30正式发布|极客头条
- 在看 | 一周网安回顾(2021.2.27—3.5)
- 常说的「缓存穿透」和「击穿」是什么
赞助链接



