licp
2024-04-03 c9303f5f4ff471081bdeb6ed2c15448a77adfb22
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
import * as pdfjsLib from 'pdfjs-dist';
import { convertToHtml } from 'mammoth';
 
export default {
  methods: {
    convertFileToHtml(file) {
      const fileType = file.type.split('/')[1];
      const fileExtension = fileType === 'pdf' ? '.pdf' : '.docx';
 
      // 将文件转换为Blob对象
      const fileReader = new FileReader();
      fileReader.onload = async (event) => {
        const arrayBuffer = event.target.result;
        const byteArray = new Uint8Array(arrayBuffer);
        const blob = new Blob([byteArray], { type: fileType + fileExtension });
 
        if (fileType === 'pdf') {
          // 使用pdfjsLib将PDF转换为HTML
          const pdfData = await pdfjsLib.getDocument(blob).promise;
          const pageNumber = 1;
          const scale = 1;
          const viewport = pageNumber * scale;
          const canvas = document.createElement('canvas');
          const context = canvas.getContext('2d');
          canvas.width = pdfData.internal.pageSize.getWidth() * scale;
          canvas.height = pdfData.internal.pageSize.getHeight() * scale;
          const renderContext = {
            canvasContext: context,
            viewport: viewport,
          };
          const renderTask = pdfData.getPage(pageNumber).render(renderContext);
          await renderTask.promise;
          const base64Image = canvas.toDataURL('image/png');
 
          // 将base64Image转换为HTML
          const htmlContent = `<img src="${base64Image}" />`;
          return htmlContent;
        } else if (fileType === 'docx') {
          // 使用mammoth将Word转换为HTML
          const htmlContent = await convertToHtml(blob, { format: 'html' });
          return htmlContent;
        }
      };
      fileReader.readAsArrayBuffer(blob);
    },
  },
};