Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

我对油猴脚本进行了完善,可以实现小红书笔记图片、文本打包下载。 #189

Open
BluerAngala opened this issue Oct 27, 2024 · 2 comments

Comments

@BluerAngala
Copy link

BluerAngala commented Oct 27, 2024

注意:本地调试时,为了美观,暂时去除了版权信息、将base64更换为了图片url

// ==UserScript==
// @name         XHS-Downloader
// @namespace    https://github.com/JoeanAmier/XHS-Downloader
// @version      1.7.3
// @description  基于XHS-Downloader二次开发的小红书工具。可以提取小红书作品/用户链接、下载小红书无水印图文/视频作品文件、下载笔记内容文本、图片笔记打包下载。
// @author       JoeanAmier 、 BluerAngala
// @match        http*://xhslink.com/*
// @match        http*://www.xiaohongshu.com/explore*
// @match        http*://www.xiaohongshu.com/user/profile/*
// @match        http*://www.xiaohongshu.com/search_result*
// @match        http*://www.xiaohongshu.com/board/*
// @grant        GM_getValue
// @grant        GM_setValue
// @grant        unsafeWindow
// @grant        GM_setClipboard
// @grant        GM_registerMenuCommand
// @license      GNU General Public License v3.0

// @require      https://cdnjs.cloudflare.com/ajax/libs/jszip/3.7.1/jszip.min.js
// ==/UserScript==



/**
 * 立即执行函数,用于初始化脚本设置和注册菜单命令
 */
(function () {
    // 从GM存储中获取免责声明状态,默认为false
    let disclaimer = GM_getValue("disclaimer", false);

    /**
     * 显示脚本说明和免责声明
     */
    const readme = () => {
        // 脚本使用说明文本
        const instructions = `这是一段介绍`
        // 免责声明文本
        const disclaimer_content = `这是一段免责声明`
        // 显示使用说明
        alert(instructions);
        // 如果用户未同意免责声明
        if (!disclaimer) {
            // 弹出免责声明确认框
            const answer = prompt(disclaimer_content, "");
            if (answer === null) {
                // 用户取消,设置disclaimer为false
                GM_setValue("disclaimer", false);
                disclaimer = false;
            } else {
                // 用户输入YES则设置为true
                GM_setValue("disclaimer", answer.toUpperCase() === "YES");
                disclaimer = GM_getValue("disclaimer");
                location.reload();
            }
        }
    };

    // 首次运行时显示说明
    if (!disclaimer) {
        readme();
    }

    // 注册"关于"菜单命令
    GM_registerMenuCommand("关于 XHS-Downloader", function () {
        readme();
    });

    // 从GM存储获取自动滚动设置,默认为true
    let scroll = GM_getValue("scroll", true);
    scroll = false;

    // 注册切换自动滚动功能的菜单命令
    GM_registerMenuCommand(`自动滚动屏幕功能 ${scroll ? '✔️' : '❌'}`, function () {
        scroll = !scroll;
        GM_setValue("scroll", scroll);
        alert('修改自动滚动屏幕功能成功!');
    });

    // 从GM存储获取滚动检测间隔,默认2500ms
    let timeout = GM_getValue("timeout", 2500);

    // 注册修改滚动检测间隔的菜单命令
    GM_registerMenuCommand("修改滚动检测间隔", function () {
        let data;
        data = prompt("请输入自动滚动屏幕检测间隔:\n如果网络环境不佳导致脚本未能加载全部作品,可以设置较大的检测间隔!", timeout / 1000);
        if (data === null) {
            return
        }
        // 转换为数字,默认2.5秒
        data = parseFloat(data) || 2.5
        timeout = data * 1000;
        GM_setValue("timeout", timeout);
        alert(`修改自动滚动屏幕检测间隔成功,当前值:${data} 秒`);
    });

    // 从GM存储获取滚动次数,默认10次
    let number = GM_getValue("number", 10);

    // 注册修改滚动次数的菜单命令
    GM_registerMenuCommand("修改滚动屏幕次数", function () {
        let data;
        data = prompt("请输入自动滚动屏幕次数:\n仅对提取发现作品、搜索作品、搜索用户链接生效!", number);
        if (data === null) {
            return
        }
        // 转换为整数,默认10次
        number = parseInt(data) || 10;
        GM_setValue("number", number);
        alert(`修改自动滚动屏幕次数成功,当前值:${number} 次`);
    });
    const icon = 'https://www.xiaohongshu.com/explore?channel_type=web_note_detail_r10'
    /**
     * 打开项目GitHub页面
     */
    const about = () => {
        window.open('https://github.com/JoeanAmier/XHS-Downloader', '_blank');
    }

    /**
     * 显示下载失败提示
     */
    const abnormal = () => {
        alert("下载无水印作品文件失败!请向作者反馈!\n项目地址:https://github.com/JoeanAmier/XHS-Downloader");
    };

    /**
     * 生成视频下载链接
     * @param {Object} note - 笔记对象
     * @returns {Array} 视频下载链接数组
     */
    const generateVideoUrl = note => {
        try {
            // 从笔记对象中提取视频链接
            return [`https://sns-video-bd.xhscdn.com/${note.video.consumer.originVideoKey}`];
        } catch (error) {
            console.error("Error generating video URL:", error);
            return [];
        }
    };

    /**
     * 生成图片下载链接
     * @param {Object} note - 笔记对象
     * @returns {Array} 图片下载链接数组
     */
    const generateImageUrl = note => {
        let images = note.imageList;
        // 匹配图片ID的正则表达式
        const regex = /http:\/\/sns-webpic-qc\.xhscdn.com\/\d+\/[0-9a-z]+\/(\S+)!/;
        let urls = [];
        try {
            // 遍历所有图片生成下载链接
            images.forEach((item) => {
                let match = item.urlDefault.match(regex);
                if (match && match[1]) {
                    urls.push(`https://ci.xiaohongshu.com/${match[1]}?imageView2/format/png`);
                }
            })
            return urls
        } catch (error) {
            console.error("Error generating image URLs:", error);
            return [];
        }
    };

    /**
     * 下载文件
     * @param {Array} urls - 下载链接数组
     * @param {string} type_ - 文件类型(video/normal)
     */
    const download = async (urls, type_) => {
        // 提取文件名
        const name = extractName();
        console.info(`基础文件名称 ${name}`);

        if (type_ === "video") {
            // 下载视频
            await downloadVideo(urls[0], name);
        } else {
            // 下载图片
            await downloadImage(urls, name);
        }
    };

    // 2024年10月27日18:32:09
    /**
     * 下载文本内容
     * @param {string} name - 文件名
     */
    const downloadText = (name, zip) => {
        const title = document.querySelector('#detail-title')?.innerText || '';
        const content = document.querySelector('#detail-desc')?.innerText || '';
        
        if (!title && !content) {
            console.info('未找到文本内容');
            return;
        }
        
        // 创建HTML内容,添加基本样式
        const htmlContent = `
            <!DOCTYPE html>
            <html>
            <head>
                <meta charset="UTF-8">
                <title>${name}</title>
                <style>
                    body {
                        font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', Roboto, Oxygen, Ubuntu, Cantarell, sans-serif;
                        max-width: 800px;
                        margin: 40px auto;
                        padding: 20px;
                        line-height: 1.6;
                    }
                    h2 { color: #333; }
                    .content { white-space: pre-wrap; }
                </style>
            </head>
            <body>
                <h2>【标题】</h2>
                <div class="content">${title}</div>
                <h2>【正文】</h2>
                <div class="content">${content}</div>
            </body>
            </html>
        `;
        
        // 将HTML内容添加到zip文件中
        zip.file(`${name}.html`, htmlContent);
        console.info('文本内容已添加到压缩包');
    };


    /**
     * 处理探索页面的下载
     * @param {Object} note - 笔记对象
     */
    const exploreDeal = async note => {
        try {
            let links;

            // 根据类型生成下载链接
            if (note.type === "normal") {
                links = generateImageUrl(note);
            } else {
                links = generateVideoUrl(note);
            }
            // 如果链接数组不为空,则下载文件
            if (links.length > 0) {
                console.info("无水印文件下载链接", links);
                await download(links, note.type);
            } else {
                // 下载失败
                abnormal()
            }
        } catch (error) {
            console.error("Error in deal function:", error);
            abnormal();
        }
    };

    /**
     * 从URL提取笔记信息
     * @returns {Object} 笔记详情对象
     */
    const extractNoteInfo = () => {
        // 匹配笔记ID的正则表达式
        const regex = /\/explore\/([^?]+)/;
        const match = currentUrl.match(regex);
        if (match) {
            return unsafeWindow.__INITIAL_STATE__.note.noteDetailMap[match[1]]
        } else {
            console.error("从链接提取作品 ID 失败", currentUrl,);
        }
    };

    /**
     * 提取下载链接并执行下载
     */
    const extractDownloadLinks = async () => {
        if (currentUrl.includes("https://www.xiaohongshu.com/explore/")) {
            let note = extractNoteInfo();
            if (note.note) {
                await exploreDeal(note.note);
            } else {
                abnormal();
            }
        }
    };

    /**
     * 下载单个文
     * @param {string} link - 下载链接
     * @param {string} filename - 文件名
     * @returns {Promise<Blob>} 文件的Blob对象
     */
    const downloadFile = async (link, filename) => {
        try {
            // 使用 fetch 获取文件数据
            let response = await fetch(link, {
                method: "GET",
            });

            // 检查响应状态码
            if (!response.ok) {
                console.error(`请求失败,状态码: ${response.status}`, response.status);
                return null;
            }

            return await response.blob();
        } catch (error) {
            console.error(`下载失败 (${filename}):`, error);
            return null;
        }
    }

    /**
     * 提取文件名
     * @returns {string} 文件名
     */
    const extractName = () => {
        // 从标题中提取合法文件名
        let name = document.title.replace(/[^\u4e00-\u9fa5a-zA-Z0-9]/g, "");
        let match = currentUrl.match(/\/([^\/]+)$/);
        let id = match ? match[1] : null;
        return name === "" ? id : name
    };

    /**
     * 下载视频文件
     * @param {string} url - 视频链接
     * @param {string} name - 文件名
     */
    const downloadVideo = async (url, name) => {
        const blob = await downloadFile(url, `${name}.mp4`);
        if (!blob) {
            abnormal();
            return;
        }

        // 创建下载链接并触发下载
        const blobUrl = window.URL.createObjectURL(blob);
        const a = document.createElement('a');
        a.href = blobUrl;
        a.download = `${name}.mp4`;
        a.click();
        window.URL.revokeObjectURL(blobUrl);
    };

    /**
     * 下载图片文件
     * @param {Array} urls - 图片链接数组
     * @param {string} name - 基础文件名
     */
    const downloadImage = async (urls, name) => {
        // 创建一个JSZip实例
        const zip = new JSZip();
        
        // 创建一个Promise数组,包含文本和图片的处理
        const promises = [
            // 添加文本内容到zip的Promise
            new Promise((resolve) => {

                // 下载文本内容到zip
                downloadText(name, zip);

                // 下载完成
                resolve(true);
            }),
            // 添加所有图片到zip的Promise数组
            ...urls.map(async (url, index) => {
                const blob = await downloadFile(url, `${index + 1}_${name}.png`);
                if (blob) {
                    zip.file(`${index + 1}_${name}.png`, blob);
                    return true;
                }
                return false;
            })
        ];

        // 等待所有操作完成
        const results = await Promise.all(promises);

        // 检查是否所有操作都成功
        if (!results.every(result => result === true)) {
            abnormal();
            return;
        }

        // 生成zip文件并下载
        const zipBlob = await zip.generateAsync({ type: "blob" });
        const blobUrl = window.URL.createObjectURL(zipBlob);
        const a = document.createElement('a');
        a.href = blobUrl;
        a.download = `${name}.zip`;
        a.click();
        window.URL.revokeObjectURL(blobUrl);
    };

    /**
     * 滚动屏幕
     * @param {Function} callback - 滚动完成后的回调函数
     * @param {boolean} endless - 是否无限滚动
     */
    const scrollScreen = (callback, endless = false) => {
        if (!scroll) {
            callback();
        } else if (endless) {
            // 无限滚动直到页面高度不再变化
            let previousHeight = 0;
            const scrollInterval = setInterval(() => {
                const currentHeight = document.body.scrollHeight;
                if (currentHeight !== previousHeight) {
                    window.scrollTo(0, document.body.scrollHeight);
                    previousHeight = currentHeight;
                } else {
                    clearInterval(scrollInterval);
                    callback();
                }
            }, timeout);
        } else {
            // 滚动指定次数
            let previousHeight = 0;
            let scrollCount = 0;
            const scrollInterval = setInterval(() => {
                const currentHeight = document.body.scrollHeight;
                if (currentHeight !== previousHeight && scrollCount < number) {
                    window.scrollTo(0, document.body.scrollHeight);
                    previousHeight = currentHeight;
                    scrollCount++;
                } else {
                    clearInterval(scrollInterval);
                    callback();
                }
            }, timeout);
        }
    };

    /**
     * 提取笔记信息
     * @param {number} order - 笔记类型序号
     * @returns {Array} 笔记ID和token数组
     */
    const extractNotesInfo = order => {
        const notesRawValue = unsafeWindow.__INITIAL_STATE__.user.notes._rawValue[order];
        return notesRawValue.map(item => [item.id, item.xsecToken,]);
    };

    /**
     * 提取专辑信息
     * @param {number} order - 专辑序号
     * @returns {Array} 笔记ID和token数组
     */
    const extractBoardInfo = order => {
        // 定义正则表达式来匹配 URL 中的 ID
        const regex = /\/board\/([a-z0-9]+)\?/;

        // 使用 exec 方法执行正则表达式
        const match = regex.exec(currentUrl);

        // 检查是否有匹配
        if (match) {
            // 提取 ID
            const id = match[1]; // match[0] 是整个匹配的字符串,match[1] 是第一个括号内的匹配

            const notesRawValue = unsafeWindow.__INITIAL_STATE__.board.boardFeedsMap._rawValue[id].notes;
            return notesRawValue.map(item => [item.noteId, item.xsecToken,]);
        } else {
            console.error("从链接提取专辑 ID 失败", currentUrl,);
            return [];
        }
    };

    /**
     * 提取Feed流信息
     * @returns {Array} 笔记ID和token数组
     */
    const extractFeedInfo = () => {
        const notesRawValue = unsafeWindow.__INITIAL_STATE__.feed.feeds._rawValue;
        return notesRawValue.map(item => [item.id, item.xsecToken,]);
    };

    /**
     * 提取搜索笔记信息
     * @returns {Array} 笔记ID和token数组
     */
    const extractSearchNotes = () => {
        const notesRawValue = unsafeWindow.__INITIAL_STATE__.search.feeds._rawValue;
        return notesRawValue.map(item => [item.id, item.xsecToken,]);
    }

    /**
     * 提取搜索用户信息
     * @returns {Array} 用户ID数组
     */
    const extractSearchUsers = () => {
        const notesRawValue = unsafeWindow.__INITIAL_STATE__.search.userLists._rawValue;
        return notesRawValue.map(item => item.id);
    }

    /**
     * 生成笔记链接
     * @param {Array} data - 笔记数据数组
     * @returns {string} 笔记链接字符串
     */
    const generateNoteUrls = data => data.map(([id, token,]) => `https://www.xiaohongshu.com/discovery/item/${id}?source=webshare&xhsshare=pc_web&xsec_token=${token}&xsec_source=pc_share`).join(" ");

    /**
     * 成用户链接
     * @param {Array} data - 用户ID数组
     * @returns {string} 用户链接字符串
     */
    const generateUserUrls = data => data.map(id => `https://www.xiaohongshu.com/user/profile/${id}`).join(" ");

    /**
     * 提取所有链接
     * @param {Function} callback - 提取完成的回调函数
     * @param {number} order - 提取类型序号
     */
    const extractAllLinks = (callback, order) => {
        scrollScreen(() => {
            let data;
            if (order >= 0 && order <= 2) {
                data = extractNotesInfo(order);
            } else if (order === 3) {
                data = extractSearchNotes();
            } else if (order === 4) {
                data = extractSearchUsers();
            } else if (order === -1) {
                data = extractFeedInfo()
            } else if (order === 5) {
                data = extractBoardInfo()
            } else {
                data = [];
            }
            let urlsString = order !== 4 ? generateNoteUrls(data) : generateUserUrls(data);
            callback(urlsString);
        }, [0, 1, 2, 5].includes(order))
    };

    /**
     * 提取链接事件处理
     * @param {number} order - 提取类型序号
     */
    const extractAllLinksEvent = (order = 0) => {
        extractAllLinks(urlsString => {
            if (urlsString) {
                GM_setClipboard(urlsString, "text", () => {
                    alert('作品/用户链接已复制到剪贴板!');
                });
            } else {
                alert("未提取到任何作品/用户链接!")
            }
        }, order);
    };

    /**
     * 创建功能容器
     * @returns {HTMLElement} 功能容器元素
     */
    const createContainer = () => {
        let container = document.createElement('div');
        container.id = 'xhsFunctionContainer';

        let imgTextContainer = document.createElement('div');
        imgTextContainer.id = 'xhsImgTextContainer';

        let img = new Image(48, 48);
        // img.src = ""
        img.src = 'https://sns-avatar-qc.xhscdn.com/avatar/645b800677c97ef1a2abc7e0.jpg?imageView2/2/w/120/format/jpg'
        img.style.borderRadius = '50%';
        img.style.objectFit = 'cover';

        let textDiv = document.createElement('div');
        textDiv.id = 'xhsImgTextContainer__text'
        textDiv.textContent = '小红书加强功能';

        imgTextContainer.appendChild(img);
        imgTextContainer.appendChild(textDiv);

        container.appendChild(imgTextContainer);

        document.body.appendChild(container);
        return container;
    };

    /**
     * 创建功能按钮
     * @param {string} id - 按钮ID
     * @param {string} text - 按钮文本
     * @param {Function} onClick - 点击事件处理函数
     * @param {...*} args - 点击事件参数
     * @returns {HTMLElement} 按钮元素
     */
    const createButton = (id, text, onClick, ...args) => {
        let button = document.createElement('button');
        button.id = id;
        button.textContent = text;
        button.addEventListener('click', () => onClick(...args));
        return button;
    };

    // 不需要移除的按钮ID
    const exclusionButton = ["xhsImgTextContainer", "About"];

    /**
     * 更新功能容器
     * @param {Array} buttons - 按钮元素数组
     */
    const updateContainer = buttons => {
        let container = document.getElementById('xhsFunctionContainer');
        if (!container) {
            container = createContainer();
        }

        // 移除除了 imgTextContainer 以外的所有子元素
        Array.from(container.children).forEach(child => {
            if (!exclusionButton.includes(child.id)) {
                child.remove();
            }
        });

        // 添加有效按钮
        buttons.forEach(button => {
            container.appendChild(button);
        });
    };

    // 创建所功能按钮
    const buttons = [
        createButton("Download", "下载无水印作品文件", extractDownloadLinks),
        createButton("Post", "提取发布作品链接", extractAllLinksEvent, 0),
        createButton("Collection", "提取收藏作品链接", extractAllLinksEvent, 1),
        createButton("Favorite", "提取点赞作品链接", extractAllLinksEvent, 2),
        createButton("Feed", "提取发现作品链接", extractAllLinksEvent, -1),
        createButton("Search", "提取搜索作品链接", extractAllLinksEvent, 3),
        createButton("User", "提取搜索用户链接", extractAllLinksEvent, 4),
        createButton("Board", "提取专辑作品链接", extractAllLinksEvent, 5),
        createButton("Disclaimer", "脚本说明及免责声明", readme,),
        createButton("About", "关于 XHS-Downloader", about,),];

    /**
     * 根据URL运行相应功能
     * @param {string} url - 当前页面URL
     */
    const run = url => {
        setTimeout(function () {
            if (!disclaimer) {
            } else if (url === "https://www.xiaohongshu.com/explore" || url.includes("https://www.xiaohongshu.com/explore?")) {
                updateContainer(buttons.slice(4, 5));
            } else if (url.includes("https://www.xiaohongshu.com/explore/")) {
                updateContainer(buttons.slice(0, 1));
            } else if (url.includes("https://www.xiaohongshu.com/user/profile/")) {
                updateContainer(buttons.slice(1, 4));
            } else if (url.includes("https://www.xiaohongshu.com/search_result")) {
                updateContainer(buttons.slice(5, 7));
            } else if (url.includes("https://www.xiaohongshu.com/board/")) {
                updateContainer(buttons.slice(7, 8));
            }
        }, 500)
    }

    // 当前页面URL
    let currentUrl = window.location.href;

    // 初始化显示免责声明按钮
    updateContainer(buttons.slice(8));

    // 初始化容器
    run(currentUrl)

    // 设置 MutationObserver 来监听 URL 变化
    let observer
    if (disclaimer) {
        observer = new MutationObserver(function () {
            if (currentUrl !== window.location.href) {
                currentUrl = window.location.href;
                run(currentUrl);
            }
        });
        const config = { childList: true, subtree: true };
        observer.observe(document.body, config);
    }

    const buttonStyle = `
    #xhsFunctionContainer {
        position: fixed;
        bottom: 15%;
        background-color: #fff;
        color: #2f3542;
        padding: 5px 10px;
        border-radius: 0 32px 32px 0;
        box-shadow: 0 3.2px 12px #00000014, 0 5px 24px #0000000a;
        transition: width 0.25s ease-in-out, border-radius 0.25s ease-in-out, height 0.25s ease-in-out;
        overflow: hidden;
        white-space: nowrap;
        width: 65px; /* 初始宽度 */
        height: 60px;
        text-align: center;
        font-size: 16px;
        display: flex;
        flex-direction: column-reverse;
        z-index: 99999;
    }
    
    #xhsFunctionContainer:hover {
        padding: 10px 10px 5px 10px;
        width: 210px; /* hover时的宽度 */
        height: auto;
    }

    #xhsFunctionContainer button {
        cursor: pointer;
        height: 48px;
        color: #ff4757;
        font-size: 14px;
        font-weight: 600;
        border-radius: 32px;
        margin-bottom: 14px;
        border: 3px #ff4757 solid;
    }
    
    #xhsFunctionContainer button:active {
        background-color: #ff4757; /* 点击时的背景颜色 */
    }
    
    #xhsImgTextContainer {
        display: flex;
        align-items: center;
        gap: 14px;
    }
    
    #xhsImgTextContainer__text {
        font-size: 14px;
        font-weight: 600;
    }
    `;
    /**
     * 创建并添加样式到页面头部
     * @param {string} buttonStyle CSS样式字符串
     * @param {string} disclaimer 免责声明内容
     */

    // 获取页面的head元素,如果不存在则获取head标签集合的第一个元素
    const head = document.head || document.getElementsByTagName('head')[0];

    // 创建style标签元素
    const style = document.createElement('style');

    // 将style标签添加到head中
    head.appendChild(style);

    // 设置style标签的type属性为css
    style.type = 'text/css';

    // 将CSS样式字符串添加到style标签中
    style.appendChild(document.createTextNode(buttonStyle));

    // 在控制台输出用户接受免责声明的信息
    console.info("用户接受 XHS-Downloader 免责声明", disclaimer)
})();

@wanghaisheng
Copy link

这个能抓评论吗

@zhouuuuuuj
Copy link

老师,请问可以自定义文件名吗,比如我想用“发布时间【作者昵称】”的格式来当文件名该怎么做呢

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants