caoyang2002

TG 下载器

· simons ·
运维

软件

https://github.com/tangyoha/telegram_media_downloader/

在 elease 里面下载可执行程序

Win

https://github.com/tangyoha/telegram_media_downloader/releases/download/v2.2.3/tdl-v2.2.3-win64.zip

Linux (x86_64)

https://github.com/tangyoha/telegram_media_downloader/releases/download/v2.2.1/tdl-v2.2.1-linux-amd64.zip

mac

没有测试 https://github.com/tangyoha/telegram_media_downloader/releases/download/v2.2.1/tdl-v2.2.1-macos.zip

配置

所有配置都通过 config.yaml 文件传递​​给 Telegram Media Downloader

获取您的 API 密钥: 第一步需要您获得有效的 Telegram API 密钥(API id/hash pair):

  1. 访问 https://my.telegram.org/apps 并使用您的 Telegram 帐户登录。
  2. 填写表格以注册新的 Telegram 应用程序。
  3. 完成! API 密钥由两部分组成:api_idapi_hash

获取聊天ID:

如果你需要下载收藏夹的内容请填me

1。使用网络电报:

  1. 打开 https://web.telegram.org/?legacy=1#/im
  2. 现在转到聊天/频道,您将看到 URL 类似
  • https://web.telegram.org/?legacy=1#/im?p=u853521067_2449618633394 这里 853521067 是聊天 ID。
  • https://web.telegram.org/?legacy=1#/im?p=@somename 这里的 somename 是聊天 ID。
  • https://web.telegram.org/?legacy=1#/im?p=s1301254321_6925449697188775560 此处取 1301254321 并将 -100 添加到 id => -1001301254321 的开头。
  • https://web.telegram.org/?legacy=1#/im?p=c1301254321_6925449697188775560 此处取 1301254321 并将 -100 添加到 id => -1001301254321 的开头。

2。使用机器人: 1.使用 @username_to_id_bot 获取chat_id - 几乎所有电报用户:将用户名发送给机器人或将他们的消息转发给机器人 - 任何聊天:发送聊天用户名或复制并发送其加入聊天链接到机器人 - 公共或私人频道:与聊天相同,只需复制并发送给机器人 - 任何电报机器人的 ID

配置文件

api_hash: your_api_hash
api_id: your_api_id
bot_token: your_bot_token
chat:
- chat_id: telegram_chat_id
  last_read_message_id: 0
  download_filter: message_date >= 2022-12-01 00:00:00 and message_date <= 2023-01-17 00:00:00
- chat_id: telegram_chat_id_2
  last_read_message_id: 0
# 我们将ids_to_retry移到data.yaml
ids_to_retry: []
media_types:
- audio
- document
- photo
- video
- voice
file_formats:
  audio:
  - all
  document:
  - pdf
  - epub
  video:
  - mp4
save_path: D:\telegram_media_downloader
file_path_prefix:
- chat_title
- media_datetime
disable_syslog:
- INFO
upload_drive:
  enable_upload_file: true
  remote_dir: drive:/telegram
  before_upload_file_zip: True
  after_upload_file_delete: True
hide_file_name: true
file_name_prefix:
- message_id
- file_name
file_name_prefix_split: ' - '
max_download_task: 5
web_host: 127.0.0.1
web_port: 5000
web_login_secret: 123
  • api_hash - 你从电报应用程序获得的 api_hash
  • api_id - 您从电报应用程序获得的 api_id
  • bot_token - 你的机器人凭证
  • chat - 多频道
    • chat_id - 您要下载媒体的聊天/频道的 ID。你从上述步骤中得到的。
    • download_filter - 下载过滤器, 查阅 如何使用过滤器
    • last_read_message_id -如果这是您第一次阅读频道,请将其设置为“0”,或者如果您已经使用此脚本下载媒体,它将有一些数字,这些数字会在脚本成功执行后自动更新。不要改变它。
  • chat_id - 您要下载媒体的聊天/频道的 ID。你从上述步骤中得到的。
  • last_read_message_id - 如果这是您第一次阅读频道,请将其设置为“0”,或者如果您已经使用此脚本下载媒体,它将有一些数字,这些数字会在脚本成功执行后自动更新。不要改变它。
  • ids_to_retry - 保持原样。下载器脚本使用它来跟踪所有跳过的下载,以便在下次执行脚本时可以下载它。
  • media_types - 要下载的媒体类型,您可以更新要下载的媒体类型,它可以是一种或任何可用类型。
  • file_formats - 为支持的媒体类型(“音频”、“文档”和“视频”)下载的文件类型。默认格式为“all”,下载所有文件。
  • save_path - 你想存储下载文件的根目录
  • file_path_prefix - 存储文件子文件夹,列表的顺序不定,可以随机组合
    • chat_title - 聊天频道或者群组标题, 如果找不到标题则为配置文件中的chat_id
    • media_datetime - 资源的发布时间
    • media_type - 资源类型,类型查阅 media_types
  • disable_syslog - 您可以选择要禁用的日志类型,请参阅 logging._nameToLevel
  • upload_drive - 您可以将文件上传到云盘
    • enable_upload_file - [必填]启用上传文件,默认为false
    • remote_dir - [必填]你上传的地方
    • upload_adapter - [必填]上传文件适配器,可以为rclone,aligo。如果为rclone,则支持rclone所有支持上传的服务器,如果为aligo,则支持上传阿里云盘
    • rclone_path,如果配置upload_adapterrclone则为必填,rclone的可执行目录,查阅 如何使用rclone
    • before_upload_file_zip - 上传前压缩文件,默认为false
    • after_upload_file_delete - 上传成功后删除文件,默认为false
  • file_name_prefix - 自定义文件名称,使用和 file_path_prefix 一样
    • message_id - 消息id
    • file_name - 文件名称(可能为空)
    • caption - 消息的标题(可能为空)
  • file_name_prefix_split - 自定义文件名称分割符号,默认为-
  • max_download_task - 最大任务下载任务个数,默认为5个。
  • hide_file_name - 是否隐藏web界面文件名称,默认false
  • web_host - web界面地址
  • web_port - web界面端口
  • language - 应用语言,默认为英文(EN),可选ZH(中文),RU,UA
  • web_login_secret - 网页登录密码,如果不配置则访问网页不需要登录

执行

python3 media_downloader.py

所有下载的媒体都将存储在save_path根目录下。 具体位置参考如下:

file_path_prefix:
  - chat_title
  - media_datetime
  - media_type

视频下载完整目录为:save_path/chat_title/media_datetime/media_type。 列表的顺序不定,可以随机组合。 如果配置为空,则所有文件保存在save_path下。

代理

该项目目前支持 socks4、socks5、http 代理。要使用它,请将以下内容添加到config.yaml文件的底部

proxy:
  scheme: socks5
  hostname: 127.0.0.1
  port: 1234
  username: 你的用户名(无则删除该行)
  password: 你的密码(无则删除该行)

如果您的代理不需要授权,您可以省略用户名和密码。然后代理将自动启用。