PaddlePaddle飞桨Linux系统Docker版安装

PP-DocLayoutV3 文档版面分析模型v1.0

PP-DocLayoutV3 是飞桨(PaddlePaddle)开源的先进文档版面分析模型。该模型能够精准识别文档中的正文、标题、表格、图片、页眉页脚等十余类版面区域,并输出像素级坐标定位。针对中文文档优化设计,支持论文、合同、书籍、报纸等复杂版式的高精度分析。作为OCR前置引擎,可有效划分文字区域与图表区域,提升后续文字识别准确率;同时支持版面还原与结构化输出,广泛应用于档案数字化、智能文档处理

PaddlePaddle飞桨Linux系统Docker版安装

最近学习和了解PP飞桨,一切从安装开始。官网的安装教程很详细:
https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/docker/linux-docker.html
记录我在安装过程中遇到的问题和解决方案。

版本选择

我选择的安装版本是:
飞桨 2.6 ,linux,docker,cpu 版本
在这里插入图片描述
因为是学习和测试,我选择包含juypter的镜像(追求新版本的可以选3.0)

#CPU版的PaddlePaddle,且镜像中预装好了 jupyter:
docker pull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddle:2.6.2-jupyter

Docker 安装

linux 查看系统版本

lsb_release -a

在这里插入图片描述
Docker 安装教程
https://docs.docker.com/engine/
我选择安装 Docker Engine,根据系统版本进入相应的安装教程:
https://docs.docker.com/engine/install/ubuntu/
在这里插入图片描述
对系统版本的要求很高,我是不是遇到Docker的大版本更新了?

安装方式有好几种:

  • 我先选择 apt 方式,需要的下载时间太长了,放弃了。
  • 通过下载安装包,再进行安装
    在这里插入图片描述

教程步骤写得很清晰,遇到的问题是下载路径确定:

  1. 基础路径:https://download.docker.com/linux/ubuntu/dists/

  2. ubuntu 内核版本:lsb_release -a
    在这里插入图片描述
    https://download.docker.com/linux/ubuntu/dists/jammy/
    https://download.docker.com/linux/ubuntu/dists/jammy/pool/stable/
    在这里插入图片描述

  3. 系统架构
    uname -a 可以查看系统架构
    我的是 x86_64
    常见的对应关系,来自网上查找,
    架构 输出结果
    i386 i386, i686
    amd64 x86_64
    arm arm, armv7l
    arm64 aarch64, armv8l
    mips mips
    mips64 mips64
    等等等 alpha, arc, blackfin, c6x, cris, frv, h8300, hexagon, ia64, m32r, m68k, metag, microblaze, mn10300, nios2, openrisc, parisc, parisc64, ppc, ppcle, ppc64, ppc64le, s390, s390x, score, sh, sh64, sparc, sparc64, tile, unicore32, xtensa

所以我这台机器最后的下载路径是:
https://download.docker.com/linux/ubuntu/dists/jammy/pool/stable/amd64/

构建docker 容器

  • 官方详细教程用的是3.0.0b1的镜像,请根据自己的需要选择镜像。
  • -v $PWD:/paddle:指定将当前路径(PWD 变量会展开为当前路径的绝对路径)挂载到容器内部的 /paddle 目录;
    我安装的是带jupyter的版本,容器中jupyter默认打开路径是 /home/paddle,所以应该写为:
    -v $PWD:/home/paddle (教程页面中也有正确的版本)
  • 远程访问juypterhub 提示服务器未启动。然后启动时提示失败:
    报错:Spawn failed: Server at http://127.0.0.1:38775/user/paddle/ didn’t respond
    最后发现我没按照教程步骤执行:
    在这里插入图片描述
    创建系统和容器中映射的路径 jupyter_docker 后,我没有执行chmod操作。执行chmod操作后,juypterhub就启动成功了。(没有进入容器分析日志文件,完全靠重复步骤找到答案,不一定准确,仅作参考。

您可能感兴趣的与本文相关的镜像

PP-DocLayoutV3 文档版面分析模型v1.0

PP-DocLayoutV3 文档版面分析模型v1.0

PaddlePaddle
OCR
PDF

PP-DocLayoutV3 是飞桨(PaddlePaddle)开源的先进文档版面分析模型。该模型能够精准识别文档中的正文、标题、表格、图片、页眉页脚等十余类版面区域,并输出像素级坐标定位。针对中文文档优化设计,支持论文、合同、书籍、报纸等复杂版式的高精度分析。作为OCR前置引擎,可有效划分文字区域与图表区域,提升后续文字识别准确率;同时支持版面还原与结构化输出,广泛应用于档案数字化、智能文档处理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值