当前位置: 首页 > 编程日记 > 正文

ceph-osd无法获取osd map导致osd down掉的解决办法

环境:ceph-12.2.1 3节点测试性能集群 60块osd
最近ceph集群中有两个osd在重启之后遇到如下问题,osd获取不到集群osdmap产生coredump:

 ceph version 12.2.1.06 (3e7492b9ada8bdc9a5cd0feafd42fbca27f9c38e) luminous (stable)1: (()+0xa2bf21) [0x7fcd91627f21]2: (()+0xf6d0) [0x7fcd8e42d6d0]3: (gsignal()+0x37) [0x7fcd8d44e277]4: (abort()+0x148) [0x7fcd8d44f968]5: (__gnu_cxx::__verbose_terminate_handler()+0x165) [0x7fcd8dd5d9d5]6: (()+0x5e946) [0x7fcd8dd5b946]7: (()+0x5e973) [0x7fcd8dd5b973]8: (()+0x5eb9f) [0x7fcd8dd5bb9f]9: (entity_addr_t::decode(ceph::buffer::list::iterator&)+0x31d) [0x7fcd9111f1bd]10: (void decode<entity_addr_t, mempool::pool_allocator<(mempool::pool_index_t)15, std::shared_ptr<entity_addr_t> > >(std::vector<std::shared_ptr<entity_addr_t>, mempool::pool_allocator<(mempool::pool_index_t)15, std::shared_ptr<entity_addr_t> > >&, ceph::buffer::list::iterator&)+0xfc) [0x7fcd91743ddc]11: (OSDMap::decode_classic(ceph::buffer::list::iterator&)+0x66a) [0x7fcd9172daca]12: (OSDMap::decode(ceph::buffer::list::iterator&)+0x8c) [0x7fcd9173ae5c]13: (OSDMap::decode(ceph::buffer::list&)+0x2e) [0x7fcd9173c41e]14: (OSDService::try_get_map(unsigned int)+0x664) [0x7fcd910ea6a4]15: (OSD::load_pgs()+0x1209) [0x7fcd910ee909]16: (OSD::init()+0x2186) [0x7fcd91106606]17: (main()+0x2e05) [0x7fcd9100bd75]18: (__libc_start_main()+0xf5) [0x7fcd8d43a445]19: (()+0x4ae306) [0x7fcd910aa306]NOTE: a copy of the executable, or `objdump -rdS <executable>` is needed to interpret this.

解决办法:将正常osd上的osdmap取出写回故障osd中

  • 设置故障osd的debug等级为20,查看出现coredump问题时osdmap的版本号,例如214
    ceph daemon osd.58 config set debug_osd 20
  • 使用ceph-objectstore-tool工具从正常osd上获取对应版本号的osdmap
    systemctl stop ceph-osd@id(正常) 该工具需要先停止osd
    ceph-objectstore-tool --op get-osdmap --epoch 314 --data-path /var/lib/ceph/osd/ceph-id --type bluestore --file osdmap314
  • 将获取到的osdmap写回故障osd里
    ceph-objectstore-tool --op set-osdmap --epoch 314 --data-path /var/lib/ceph/osd/ceph-58 --type bluestore --file osdmap314
  • 启动故障osd即可
    systemctl start ceph-osd@58

相关文章:

读书笔记2013第13本:《怎样解题》

《怎样解题》这本书是在看《编程大师访谈录》&#xff08;中文版第12页&#xff09;这本书时无意发现的&#xff0c;一个编程大师推荐这本书来指导编程设计&#xff0c;google到这本书后粗略地翻看了一遍&#xff0c;发现是一本教学生如何解数学题的非常有年头的书。随着仔细品…

suse linux登录黑屏,SUSE Linux登录时黑屏解决办法

我采用的virtual pc虚拟机&#xff0c;安装redhat enterprise 4 linux&#xff0c;安装后出现花屏&#xff0c;通过GRUB的单用户模式下修改/etc/X11/xorg.con我采用的virtual pc虚拟机&#xff0c;安装RedHat enterprise 4 linux&#xff0c;安装后出现花屏&#xff0c;通过GRU…

应用构建工具包 Ecere SDK

Ecere SDK是一个跨平台的工具包构建软件应用程序。目前运行在Windows、Linux和Mac OS X(通过X11)。通过 Ecere SDK,可以开发一次应用程序,并将其部署在所有支持的平台上与一个轻量级运行时环境。它引入了eC这个面向对象语言来源于和完全兼容C,性能好也易于使用。一个内置的3d引…

第39-43课 thinkphp5完成商品会员价格功能(后置勾子afterInsert)

目录 功能一:利用后置勾子,处理好商品主键id,会员的价格,再插入member_price表里.要实现的功能:思路:html里控制器里模型里的后置勾子afterInsert()功能二:利用后置勾子,上传图片,批量生成缩略图,再插入goods_photo表里.要实现的功能:控制器里的用调用模型用save()方法保存模型…

codeforces A. Jeff and Digits 解题报告

题目链接&#xff1a;http://codeforces.com/problemset/problem/352/A 题目意思&#xff1a;给定一个只有0或5组成的序列&#xff0c;你要重新编排这个序列&#xff08;当然你可以不取尽这些数字&#xff09;&#xff0c;使得这个序列尽可能地大&#xff0c;并且能被90除尽。 …

内核方式挂载cephfs

我们内核挂载的前提是&#xff1a;看到centos7.5 中默认内核3.10.0-862.11.6.el7.x86_64的挂载fs执行文件读写性能更优良&#xff0c;所以尝试将3.10.0-862.11.6.el7.x86_64模块中与ceph fs挂载相关的ceph.ko,libceph.ko,dns_resolver.ko,libcrc32c.ko拷贝到自己的设备。 同样要…

汉诺塔怎么加计数次数c语言,C语言计算汉诺塔最小移动步数 (二)

前几天写的&#xff1a;C语言计算汉诺塔最小移动步数(一)当时还不知道用2^n-1这个公式来求解汉诺塔移动步骤。_偶然间在网上发现了这个公式&#xff0c;发现当时写的算法还是比较繁琐的。所以又根据这个公式又写了一个。那篇的实现是两个数组来回赋值&#xff0c;这个是用一个数…

Myeclipse 8.0 +Flash builder 4 plugin 的实现

其实过程非常&#xff0c;简单&#xff0c;但是我之前在网上找了很多资料都说&#xff0c;需要先装 Eclipse 3.5 &#xff0c;然后安装MyEclipse 8.0的插件到Eclipse&#xff0c;最后再安装Flash builder 的插件&#xff0c;期间还要进行一些文件的复制和转移等&#xff0c;弄得…

DHCP服务搭建

DHCP服务 一、DHCP概述 DHCP&#xff08;Dynamic Host Configuration Protocol&#xff0c;动态主机配置协议&#xff09;通常被应用在大型的局域网络环境中&#xff0c;主要作用是集中的管理、分配IP地址&#xff0c;使网络环境中的主机动态的获得IP地址、Gateway地址、DNS服务…

根据c语言数组定义填写下表,C语言程序设计 自测题(三)

{ n;if(n%3!0) continue;k--; }printf("%d,%d/n",k,n);}程序运行后的输出结果是______。A、1,1B、2,2C、3,3D、4,435、以下不能正确定义二维数组的选项是______。A、int a[2][2]{{1},{2}};B、int a[][2]{1,2,3,4};C、int a[2][2]{{1},2,3}D、int a[2][]{{1,2},{3,4}…

linux if 命令判断条件总结

linux if命令 关于文件属性的判断式 -a 如果文件存在 -b 如果文件存在&#xff0c;且该文件是区域设备文件 -c 当file存在并且是字符设备文件时返回真 -d 当pathname存在并且是一个目录时返回真 -e 当pathname指定的文件或目录存在时返回真 -f 当file存在并且是普通文件时返回真…

ppt文本框显示缺字,信息显示不全

1.在文字后面加个空格。2.重新调整文本框大小3.不需要打开ppt&#xff0c;而是在图标上右键属性-摘要&#xff0c;把标题、主题、作者等描述全部清空或改成与本机用户一至即可。因为文本框少子是信息不匹配&#xff0c;就像歌曲在mp3里播放出现的乱码一样。具体能否解决问题&am…

property装饰器

# 需要了解的property的用法 class People:def __init__(self,name):self.__namenamepropertydef name(self):return <name:%s> %self.__namename.setterdef name(self,new_name):if type(new_name) is not str:print(名字必须是str类型)returnself.__namenew_namename.d…

f-fdisk做磁盘分区,起始扇区从2048块开始

文章目录First Sector 起始扇区fdisk工具加分区fdisk删除分区First Sector 起始扇区 默认从第2048块扇区开始是因为,由于EFI的兴起&#xff0c;要给EFI 代码留磁盘最开始的1M空间&#xff0c;即2048*521/(1024*1024)1M With the death of the legacy BIOS (ok, its not quite …

c语言 静态链表插入排序,数据结构C语言版 表插入排序

西门豹治邺奇计数据结构C语言版 表插入排序.txt两个人吵架&#xff0c;先说对不起的人&#xff0c;并不是认输了&#xff0c;并不是原谅了。他只是比对方更珍惜这份感情。/*数据结构C语言版 表插入排序算法10.3 P267-P270编译环境&#xff1a;Dev-C 4.9.9.2日期&#xff1a;201…

C/C++流程图生成器 C转流程图【worldsing笔记】

此版本仅供学习&#xff0c;请大家支持正版软件&#xff01;&#xff01; AutoFlowChart v3.1软件下载&#xff1a; http://url.cn/OUK17C 支持导出&#xff1a;word、visio、图片格式。 例如&#xff1a;main.c #include "stdio.h" void main () {int s ; void f(in…

iOS编码:如何创建gbk编码

原文摘自&#xff1a;http://www.cnblogs.com/kiao295338444/articles/2590031.html 我们知道&#xff0c;使用NSURLConnection的代理方法下载网页&#xff0c;存到一个NSData中&#xff0c; NSMutableData *pageData; [pageData appendData:data]; 如果网页编码是UTF-8的&…

docker获取镜像很慢解决办法

docker pull selenium/hub获取非常慢 可以使用docker中国的官方镜像加速 docker pull registry.docker-cn.com/selenium/hub 官方加速&#xff1a;https://www.docker-cn.com/registry-mirror 转载于:https://www.cnblogs.com/gcgc/p/9845050.html

C语言生成一个随机的九行九列数独,一个随机生成数独的C++程序

下面是编程之家 jb51.cc 通过网络收集整理的代码片段。编程之家小编现在分享给大家&#xff0c;也给大家做个参考。//mySIZE是数独棋盘的边长&#xff0c;棋盘是mySIZE*mySIZE的大小int mySIZE 9;void print(const vector> &num){for (int i 0; i < mySIZE; i){for…

ceph中使用ceph-objectstore-tool将pg从incomplete标记为complete

起始原因是集群中部分osd元数据丢失&#xff0c;导致集群部分pg状态一直为incomplete&#xff0c;从而无法恢复为activateclean 所以同事介绍之前调研得ceph-objectstore-tool工具来做这样一个pg incomplete状态的恢复 普及一下incomplete状态表示&#xff1a;Peering过程中由…

Notification和KVO有什么不同

Notification是推送通知&#xff0c;我们可以建立一个通知中心&#xff0c;存放创建多个通知&#xff0c;在不同的地方在需要的时候push调用和KVO不同的是&#xff0c;KVO是键值观察&#xff0c;只能观察一个值&#xff0c;这就是区别转载于:https://www.cnblogs.com/ccguo/p/3…

Mysql修改设置root密码的命令及方法

2019独角兽企业重金招聘Python工程师标准>>> 方法一&#xff1a;使用SQL语句命令UPDATE 需用到Mysql自带的加密函数PASSWORD(string)&#xff0c;该函数对一个明文密码进行加密&#xff0c;但不能解密。专门用于mysql.user(用户权限表)中设置密码&#xff0c;命令如…

Android开发笔记1.2

1.2.1环境配置 配置Java环境&#xff0c; 在网上搜索一下&#xff0c;这样的教程有很多&#xff0c;我在这里就不做赘述了。 1.2.2开发第一个程序 我个人学习的是用Android Studio开发的&#xff0c;所以需要下载编辑器AndroidStudio。当然在安装过程中&#xff0c;下载的版本…

ceph osd混合部署和普通部署

文章目录混合osd的部署先部署所有的ssd部署hdd普通OSD的部署当OSD被踢出集群但是挂载点还在&#xff0c;为osd添加id验证测试OSD压力Mark osd 为down混合osd的部署 混合osd指的是将osd的db,wal分区放在ssd上同时该ssd剩下的容量也会做osd 先部署所有的ssd 在/etc/ceph.conf中…

c语言simpson积分计算方法,数值分析复化Simpson积分公式和复化梯形积分公式计算积分的通用程序...

数值分析复化Simpson积分公式和复化梯形积分公式计算积分的通用程序数值分析第五次程序作业PB09001057 孙琪【问题】分别编写用复化Simpson积分公式和复化梯形积分公式计算积分的通用程序&#xff1b; 用如上程序计算积分&#xff1a; I f sin x dx 0取节点xi &#xff0c; i0…

linux 光驱挂载

对于光驱设备的挂载&#xff1a; 首先创建一个文件夹&#xff1a;mkdir /mnt/cdrom&#xff08;名字位置任意&#xff09;mount /dev/cdrom /mnt/cdrom&#xff08;将光盘挂载到新建的/mnt下的 /cdrom目录&#xff09;转载于:https://www.cnblogs.com/foxhasdream/p/3356503.h…

Android中的HTTP通信

自己整理&#xff0c;整理得不好&#xff0c;不喜勿喷&#xff01; HTTP通信 HttpURLConnection接口 HTTP超文本传输协议&#xff0c;用于传送WWW方式的数据。HTTP协议采用了请求/响应模式。 Android提供了HTTPURLConnection和HttpClient接口来开发HTTP程序。 HTTP使用最多的就…

ceph admin socket修改ceph配置文件

目前有两种动态修改的方式来让ceph中各个组件的配置生效&#xff0c;所以介绍如下两种方式方便我们进行功能或者代码的调试 使用ceph daemon方式修改 ceph daemon osd.0 help用于osd的daemon服务ceph daemon mon.ceph-node1 help用于mon的admin socket命令、ceph daemon osd.…

持续集成之戏说Check-in Dance

《infoq》 众所周知&#xff0c;敏捷软件开发方法中有多种最佳实践&#xff0c;既有管理方面的&#xff0c;也有技术方面的。在尝试敏捷之初&#xff0c;并不是每个团队都能使用全部最佳实践&#xff0c;也不是每个实践都能在短时间内见效。但其中有一种最佳实践却是团队的必选…

C语言的基础题目,几个c语言的基础题目

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼{day_number day_1 day_2 day_3 day_4 day_5 day;printf("%d年%d月%d日为这一年的第%d天&#xff01;\n", year, month, day, day_number);}else{printf("输入的日不合法&#xff01;\n");}break;case 7…