【MinIO】几个有用的方法

news/2024/8/27 21:45:29 标签: Minio

Minio_0">在windows总安装Minio

这是一篇不错的安装指南
进入网址
在这里插入图片描述
在Windows安装时,选择相应的exe文件下载,下载到本地后,使用如下的命令即可在前台启动:

minio.exe server D:\your_path

或者将该路径写进环境变量的path中,用来为minio指定数据存储路径。
执行成功的效果如下如所示:
在这里插入图片描述

Minio_12">在python中使用Minio

python中安装minio

pip install minio

promtp shell启动minio,注意该shell不能关闭

minio.exe server D:\MinIO  # 后面的路劲是存放数据的地址

浏览器打开127.0.0.1:9000
输入默认账户和密码minioadminminioadmin

获取bucket中的对象

通过list_objects获取Minio中的对象

objects = client.list_objects(bucket_name, prefix=None, recursive=True)
for obj in objects:
    print(obj.bucket_name, obj.object_name.encode('utf-8'), obj.last_modified,
           obj.etag, obj.size, obj.content_type) # 进一步查看object的属性

Minio_32">上传本地文件到Minio

通过fput_object方法可以将本地文件上传到Minio

# 上传文件,bucket_name 桶名称, object_name: 上传到桶中的完整的文件路径, file_path:文件本地所在完整路径
result = client.fput_object(bucket_name=bucket_name,object_name='data1/'+file_name,
   file_path=file_path+"/"+file_name)
print(result.object_name,result.bucket_name, result.etag)

Minio_44">从Minio下载图片到本地

通过fget_object方法可以将文件从Minio下载到本地

client.fget_object(
    'test', 'baike_knowledge/46c88e9e080efc4c0e8742e022130d7e/20231109112809770.jpeg', 'this.jpeg')

Minio_51">爬取图片url,并上传到Minio

使用request库爬取网络图片,并使用Minioupload_pictures()方法将数据上传到MinIO

import requests
from io import BytesIO
from minio import Minio
from minio.error import S3Error
from hashlib import md5
import datetime


minio = Minio(endpoint="127.0.0.1:9000",
              access_key='minioadmin',
              secret_key='minioadmin',
              secure=False)

def upload_pictures(client, source_url, pic_url, bucket_name, spider_name):
    try:
        response = requests.get(pic_url)  # crawling picture
        image = BytesIO(response.content) # change the picture to bytes type
        size = len(image.getvalue())  # calculate the object size
        page_md5 = md5(str(source_url).encode("utf-8")).hexdigest() #  use md5(url) as piece of file name
        timestamp = datetime.datetime.now().strftime("%Y%m%d%H%M%S%f")[:-3] # timestamp as part of object_name
        content_type = pic_url.split('.')[-1] # get picture type: jpg, png, jpeg etc.
        # Upload the image to MinIO server
        client.put_object(bucket_name=bucket_name, object_name=f"{spider_name}/{page_md5}/{timestamp}.{content_type}", data=image,
                          content_type=f"image/{content_type}", length=size)
        # when you extract data, you should not includ the bucket name in the whole path
        pic_path = f'{bucket_name}/{spider_name}/{page_md5}/{timestamp}.{content_type}'
        # logging.info(f'save picture to minio path {pic_path}')
        return pic_path
    except requests.exceptions.InvalidURL:
        print("无效的 URL")
    except requests.exceptions.HTTPError as e:
        print(f"HTTP 错误: {e}")
    except S3Error as err:
        print("Error occurred: ", err)
    except Exception as e:
        print(f"发生错误: {e}")
    return None

移除MinIO中size为0的object

from minio import Minio

minio = Minio(endpoint="127.0.0.1:9000",
              access_key='minioadmin',
              secret_key='minioadmin',
              secure=False)

def remove_zero_size(client, bucket_name):
    object = client.list_objects(bucket_name, prefix=None, recursive=True)
    for obj in object:
        print(obj.bucket_name, obj.object_name.encode('utf-8'), obj.last_modified,
               obj.etag, obj.size, obj.content_type) # 进一步查看object的属性
        if obj.size == 0:
            # Remove an object.
            client.remove_object(bucket_name, obj.object_name.encode('utf-8'))
remove_zero_size(minio, bucket_name='size')

函数说明 https://www.bookstack.cn/read/miniocookbookzh/24.md
https://blog.csdn.net/weixin_40547993/article/details/110682587

https://blog.csdn.net/quyingzhe0217/article/details/129727120
https://blog.csdn.net/Deaohst/article/details/128699370
https://www.python100.com/html/Q2I2IO5C25Z5.html
https://www.cnblogs.com/mian-1122/p/17463849.html
安装minio https://zhuanlan.zhihu.com/p/514794125
https://blog.csdn.net/m0_72838865/article/details/126599849
https://blog.csdn.net/LONG729564606/article/details/129331498
https://blog.csdn.net/feritylamb/article/details/126246293


http://www.niftyadmin.cn/n/5213717.html

相关文章

抖音小店什么样的品是爆品?如何选品?三年实战经验分享!

我是电商珠珠 抖音所发展的电商平台-抖音小店,素来以兴趣电商为发展模式,所以和传统的平台并不一样。 抖音平台内,主讲的是兴趣,有兴趣才会有需求。 那么新手选择什么样的品才会更加容易爆单? 1、颜值 按照平台的…

利用STM32CubeMX解读时钟树

1,低速时钟 LSE是外部晶振作时钟源,主要提供给实时时钟模块,所以一般采用32.768KHz。LSI是由内部RC振荡器产生,也主要提供给实时时钟模块,频率大约为40KHz。(LSE和LSI)只是提供给芯片中的RTC(实时时钟)及IWDG(独立看门…

【2023传智杯】第六届传智杯程序设计挑战赛AB组-ABC题解题分析详解【JavaPythonC++解题笔记】

本文仅为第六届传智杯程序设计挑战赛-题目解题分析详解的解题个人笔记,个人解题分析记录。 本文包含:第六届传智杯程序设计挑战赛题目、解题思路分析、解题代码、解题代码详解 文章目录 一.前言二.比赛题目(AB俩组)A题题目B题题目C题题目三.解题代码A题解题思路解题代码【J…

Spring cloud - Feign

Feign的作用 Feign是Netflix公司开发的声明式web客户端组件,Spring对Feign做了无缝集成: Feign is a declarative web service client. It makes writing web service clients easier. To use Feign create an interface and annotate it. It has plugg…

医疗机构最核心的资源是什么?如何利用去获取客流?

核心资源一:医生——直接影响医疗机构口碑声誉 核心资源二:效率——直接影响患者满意度 医生为患者提供专业医疗服务的同时,也得确保高效地处理患者就诊需求,这是保障机构的服务质量和长久发展的根本。 那么该如何有效提升资源的…

使用YOLOV8 CLI训练自己的数据集

YOLOV8现在可以直接通过命令行工具运行训练, 推理过程了, 方法如下, 首先安装ultralytics的包: pip install ultralytics接着尝试使用yolov8n来简单做个推理: yolo taskdetect modepredict modelyolov8n.pt conf0.25 sourcesome_picture.jpeg接下来我们使用一个安全防护, 包括…

中国开源年度报告.问卷篇第二轮抽奖来袭!

中国开源年度报告.问卷篇第二轮抽奖来袭!填问卷,赢鼠标垫,共建未来! 中国开源年度报告由开源社发起,旨在多维度、多方式、多协作地呈现国内开源的发展情况。今年,我们再次邀请您一同参与,成为这…

激活函数与其导数:神经网络中的关键元素

激活函数是神经网络中的重要组成部分,有力地推动了深度学习的发展。然而,仅仅了解和选择激活函数是不够的,我们还需要理解激活函数的导数。本文将详细介绍激活函数的概念、作用及其导数的重要性,并探究导数对神经网络训练的影响。…