Paperless-ngx 体验无纸化生活

无纸化办公
无纸化办公指的是在工作流程中,尽量减少或完全消除对纸张的依赖,通过数字化技术和电子设备来进行信息的创建、存储、共享和处理。 其意义主要包括以下几个方面: 节约成本:减少纸张的采购、打印、存储等费用,降低办公成本。 提高效率:信息的传递和处理更加迅速,减少了文件传递和查找的时间。 环保可持续:降低对树木的砍伐,减少能源消耗和废弃物排放,有利于环境保护。 便于管理和检索:电子文件更容易分类、归档和搜索,提高了信息管理的便利性和准确性。 增强信息安全性:可以通过加密、权限设置等手段更好地保护敏感信息,降低信息泄露的风险。 促进协同工作:方便团队成员在不同地点同时访问和编辑文件,提高协同工作的效率和质量。 适应数字化趋势:使企业或组织更好地跟上数字化时代的发展步伐,提升竞争力。
Paperless
Paperless-ngx 是一个由社区支持的开源文档管理系统,它可以将您的实体文件转换为可搜索的在线档案,这样您就可以无纸化办公,提高效率。
功能
- 使用标签、通信人、类型等对扫描的文档进行组织和索引。
- 您的数据本地存储在您的服务器上,绝不会以任何方式传输或共享。
- 对您的文档执行光学字符识别(OCR),即使是仅包含图像的扫描文档也能添加可搜索和可选的文本。
- 利用开源的 Tesseract 引擎识别 100 多种语言。
- 文档以 PDF/A 格式保存,专为长期存储设计,同时保留未更改的原始文档。
- 使用机器学习自动为您的文档添加标签、通信人和文档类型。
- 支持 PDF 文档、图像、纯文本文件、Office 文档(Word、Excel、PowerPoint 以及 LibreOffice 等效文档)等更多格式。
- 无纸化将您的文档以明文形式存储在磁盘上。文件名和文件夹由无纸化管理,其格式可以通过不同的配置自由* 设置,并为不同的文档分配不同的配置。
- 美观、现代的网络应用程序具有以下特点:
- 带有统计信息的可定制仪表板。
- 通过标签、通信人、类型等进行筛选。
- 对标签、通信人、类型等进行批量编辑。
- 在整个应用程序中拖放上传文档。
- 可定制的视图可以保存并显示在仪表板和 / 或侧边栏上。
- 支持各种数据类型的自定义字段。
- 带有可选过期时间的可共享公共链接。
- 全文搜索帮助您找到所需内容:
- 自动完成功能从您的文档中建议相关词汇。
- 结果根据与您的搜索查询的相关性进行排序。
- 突出显示向您展示文档的哪些部分与查询匹配。
- 搜索类似文档(“更多类似此文档”)
- 电子邮件处理:从您的电子邮件账户导入文档:
- 为每个账户配置多个账户和规则。
- 处理后,无纸化可以对邮件执行诸如标记为已读、删除等操作。
- 内置强大的多用户权限系统,支持 “全局” 权限以及每个文档或对象的权限。
- 强大的工作流系统,为您提供更多控制。
- 针对多核系统进行优化:Paperless-ngx 并行处理多个文档。
- 集成的健全性检查器确保您的文档存档状况良好。
快速安装
利用以下命令可以快速生成配置文件并启动容器
bash -c "$(curl --location --silent --show-error https://raw.githubusercontent.com/paperless-ngx/paperless-ngx/main/install-paperless-ngx.sh)"
生成的文件参考
docker-compose.env
PAPERLESS_URL=https://paperless.xintech.fun
USERMAP_UID=0
USERMAP_GID=0
PAPERLESS_TIME_ZONE=Asia/Shanghai
PAPERLESS_OCR_LANGUAGE=chi_sim
PAPERLESS_SECRET_KEY='qe:+H~10R}Kgm<mSY;oaSBcZGor5.L5#)4=?xVE7lCYai1h2*54/<m9|TIih&.O9'
PAPERLESS_OCR_LANGUAGES=chi-sim
注意 PAPERLESS_OCR_LANGUAGES 与 PAPERLESS_OCR_LANGUAGE 的语言标识的表示方式,否则无法正常安装,或提示无法安装语言包,或所选语言不存在。
docker-compose.yml
# Docker Compose file for running paperless from the Docker Hub.
# This file contains everything paperless needs to run.
# Paperless supports amd64, arm and arm64 hardware.
#
# All compose files of paperless configure paperless in the following way:
#
# - Paperless is (re)started on system boot, if it was running before shutdown.
# - Docker volumes for storing data are managed by Docker.
# - Folders for importing and exporting files are created in the same directory
# as this file and mounted to the correct folders inside the container.
# - Paperless listens on port 8000.
#
# SQLite is used as the database. The SQLite file is stored in the data volume.
#
# To install and update paperless with this file, do the following:
#
# - Copy this file as 'docker-compose.yml' and the files 'docker-compose.env'
# and '.env' into a folder.
# - Run 'docker compose pull'.
# - Run 'docker compose run --rm webserver createsuperuser' to create a user.
# - Run 'docker compose up -d'.
#
# For more extensive installation and update instructions, refer to the
# documentation.
services:
broker:
image: docker.io/library/redis:7
restart: unless-stopped
volumes:
- redisdata:/data
webserver:
image: ghcr.io/paperless-ngx/paperless-ngx:latest
restart: unless-stopped
depends_on:
- broker
ports:
- "8000:8000"
volumes:
- ./data:/usr/src/paperless/data
- ./media:/usr/src/paperless/media
- ./export:/usr/src/paperless/export
- ./paperless-ngx/consume:/usr/src/paperless/consume
env_file: docker-compose.env
environment:
PAPERLESS_REDIS: redis://broker:6379
volumes:
redisdata:
另外利用Caddy实现反向代理
paperless.xintech.fun {
reverse_proxy 127.0.0.1:8000
}
参考
Publish on 2024-11-12,Update on 2025-02-10