当前位置:首页 > 技术 > Python > 正文内容

word转换服务python版本

Watrt3年前 (2023-04-07)Python16900

网页无法打开word文档。但是可以转换为pdf来在网页上找开。用python实现在线转换服务。

from flask import Flask, request, jsonify,redirect,send_from_directory
from win32com.client import constants,gencache
import requests
import os
import pythoncom

app = Flask(__name__)

#定义pdf方法
'''
wordPath:word的文件路径
pdfPath:pdf生成的路径
'''
def Word_to_Pdf(Word_path,Pdf_path):
    pythoncom.CoInitialize()
    word = gencache.EnsureDispatch('Word.Application')
    doc = word.Documents.Open(Word_path,ReadOnly = 1)
    # 转换方法
    doc.ExportAsFixedFormat(Pdf_path,constants.wdExportFormatPDF)
    word.Quit()
@app.route('/convert', methods=['POST'])
def convert_file():
    file_url = request.json.get('fileurl')  # 获取JSON请求中的文件地址参数
    if not file_url:
        return jsonify({'error': '文件参数错误'}), 400  # 如果没有传递文件地址参数,返回错误
    doc_filename = file_url.split('/')[-1]  # 提取文件名
    doc_filepath = os.path.join(os.getcwd()+'./tmp', doc_filename)  # 临时文件路径
    pdf_filename = doc_filename.split('.')[0] + '.pdf'  # 将文件名后缀更改为.pdf
    pdf_filepath = os.path.join(os.getcwd()+'/tmp', pdf_filename)  # 临时PDF文件路径
    r = requests.get(file_url)
    with open(doc_filepath,"wb") as code:
        code.write(r.content)
    print(doc_filepath)
    print(pdf_filepath)
    try:
        Word_to_Pdf(doc_filepath, pdf_filepath)  # 将Word文档转换为PDF
    except Exception as e:
        return jsonify({'error': str(e)}), 500  # 转换失败,返回错误
    return jsonify({'pdfurl': f'http://localhost:88/pdf/{pdf_filename}'}), 200  # 如果成功,返回PDF文件地址

@app.route('/pdf/<filename>', methods=['GET'])
def get_pdf(filename):
    
     root_dir = os.getcwd()
     print(os.path.join(root_dir, 'tmp'))
     return send_from_directory(os.path.join(root_dir, 'tmp'), filename)

if __name__ == '__main__':
    app.run('127.0.0.1',"88")

上来代码已经通过测试。注意模块的安装。转换是调用的win32接口。请求使用json格式如下:

{
    "fileurl": "http://www.028icp.com/upfiles/fujian/20101029152391314456.doc"
}

请求地址是:http://127.0.0.1:88/convert

成功后返回的格式如下:

{
    "pdfurl": "http://localhost:88/pdf/20101029152391314456.pdf"
}

image.png

打赏 支付宝打赏 微信打赏
分享给朋友:

相关文章

python编写的简单http请求和应答

python编写的简单http请求和应答

响应(服务端)import machine import socket pins = [machine.Pin(i, machine.Pin.IN) for i in (0, 2, 4, 5, 12, 13, 14, 15)] adc = machine.ADC(0) html = &quo...

micropython中使用rtc设置时间

micropython中使用rtc设置时间

micropython中使用rtc设置时间from machine import RTC rtc = RTC() rtc.datetime((2017, 8, 23, 1, 12, 48, 0, 0)) # set a specific date and time print(rtc.datetime(...

micropython 使用ili9163显示IP地址

micropython 使用ili9163显示IP地址

mian.pyexec(open('./wifi.py').read(),globals()) exec(open('./tft.py').read(),globals())wifi.pyimport network import machine import ntptime import time nic = network.WLAN(network.STA_IF) # c...

Python使用struct处理二进制(pack和unpack用法)

Python使用struct处理二进制(pack和unpack用法)

有的时候需要用python处理二进制数据,比如,存取文件,socket操作时.这时候,可以使用python的struct模块来完成.可以用 struct来处理c语言中的结构体. struct模块中最重要的三个函数是pack(), unpack(), calcsize()pack(fmt, v1, v2, ...)     按照给定的格式(fmt),把数据封装成字符串(实际上是类似于c结构体的字节流) un...

asyncio --- 异步 I/O http服务代码

asyncio --- 异步 I/O http服务代码

import asyncioasync def service(reader,writer):    data = await reader.read(1024) #同步读取数据    data =data.decode().replace('\r','<br/>')    print(writer.get_extra_info('peername'))   &nbs...

Python内置函数

Python内置函数

以下是 Python 中的全部内置函数,并列出了它们的作用和参数说明。请注意,以下列出的内置函数是基于 Python 3.9 版本。abs(): 返回一个数的绝对值。参数:abs(x)all(): 如果可迭代对象中的所有元素都为 True,则返回 True。参数:all(iterable)any(): 如果可迭代对象中的任何元素为 True,则返回 True。参数:any(iterable)ascii(): 返回一个包含 ASCII 转义字符的字符串表示。参数:ascii(object)bin(...

使用 tqdm 库在控制台中实现进度条

使用 tqdm 库在控制台中实现进度条

简单用法:from tqdm import tqdm  for i in tqdm(range(2)):   pass100%|███████████████████| 2/2 [00:00<00:00, 1998.72it/s]  从上面可以看到生成一个长度为2的列表传入tqdm中,在for中迭代,此时输出了进度条,这里tqdm全部使用了默认参数,默认进度条样式就是如上所示;通常默认进度条所输出...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。