智能边缘平台常见问题文档版本01发布日期2021-02-20华为技术有限公司版权所有华为技术有限公司2021.
保留一切权利.
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播.
商标声明和其他华为商标均为华为技术有限公司的商标.
本文档提及的其他所有商标或注册商标,由各自的所有人拥有.
注意您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内.
除非合同另有约定,华为公司对本文档内容不做任何明示或默示的声明或保证.
由于产品版本升级或其他原因,本文档内容会不定期进行更新.
除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保.
文档版本01(2021-02-20)版权所有华为技术有限公司i目录1边缘节点.
11.
1边缘节点故障如何处理11.
2边缘节点有哪些故障场景61.
3边缘节点纳管失败如何处理61.
4GPU驱动安装错误如何处理131.
5设备属性更新后,在容器内可以获取最新的设备属性么141.
6设备与节点绑定以后,能用来做什么151.
7边缘节点支持多个显卡么151.
8正在运行中的边缘节点可以更换显卡么151.
9边缘环境的安全是怎么解决的151.
10边缘节点查看不到监控数据的原因161.
11边缘节点被删除后如何恢复,是只需要再纳管一次,还是要重新注册171.
12边缘节点IP地址变化会有什么影响171.
13NTP无法修改时如何处理171.
14如何同步NTP服务器171.
15如何获取IEF云端服务IP地址.
192边缘应用.
212.
1下发应用到边缘节点失败.
212.
2容器应用在边缘节点启动失败.
232.
3容器应用升级失败.
262.
4容器镜像拉取失败.
272.
5为什么看不到应用日志和系统日志312.
6怎么知道函数有没有正确执行.
312.
7函数启动失败的原因.
312.
8为什么需要使用nvidia-gpu-installer.
sh安装GPU驱动这种方式和在操作系统上直接安装GPU驱动有什么不同322.
9应用GPU资源调度方式.
322.
10如何控制容器引擎占用磁盘空间大小323边云消息.
343.
1什么是路由管理.
343.
2路由管理中的端点是什么343.
3消息路由是什么343.
4创建消息路由失败是什么原因34智能边缘平台常见问题目录文档版本01(2021-02-20)版权所有华为技术有限公司ii3.
5消息路由转发失败是什么原因343.
6消息路由的启用与停用354网络管理.
364.
1边缘节点一般通过什么网络连接到IEF364.
2使用proxy网络代理时如何处理365基本概念.
385.
1什么是智能边缘平台385.
2使用智能边缘平台能带来哪些收益385.
3智能边缘平台的主要使用场景385.
4什么是边缘函数395.
5什么是函数依赖库与函数是什么关系395.
6可以用什么语言编写函数395.
7函数的远程控制和长时间运行分别代表什么含义396其他.
406.
1区域和可用区.
406.
2智能边缘平台支持边缘节点的规格416.
3什么场景下适用函数什么场景下适用容器436.
4设备属性和设备孪生有什么区别436.
5IEF需要使用什么编程语言开发436.
6IEF需要自己提供节点吗436.
7IEF欠费后,之前下发的应用还能用吗446.
8IEF与IoT边缘有什么区别.
446.
9如何为IAM用户/子帐号配置IEF使用权限.
446.
10自动创建委托失败如何解决.
45智能边缘平台常见问题目录文档版本01(2021-02-20)版权所有华为技术有限公司iii1边缘节点1.
1边缘节点故障如何处理故障现象边缘节点显示状态为故障,如下所示,将鼠标移动到上,会显示故障原因.
排查思路边缘节点故障有如下原因,请根据如下原因排查处理.
智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司1表1-1排查思路可能原因处理措施边缘节点关机边缘节点关机容器引擎故障,包括容器引擎未启动和容器引擎服务异常边缘节点本地容器引擎服务异常节点磁盘空间不足边缘节点容器磁盘空间不足边缘节点/opt/IEF磁盘空间不足边缘节点/var/IEF/sys/log磁盘空间不足边缘节点网络连接异常边缘节点网络连接异常GPU驱动异常GPU驱动异常边缘节点的核心组件(edgecore)异常IEF在边缘节点的核心组件(edgecore)异常边缘节点强行关机并之后强行开机,系统进入恢复模式边缘节点强行关机并之后强行开机,系统进入恢复模式边缘节点关机边缘节点关机后,边缘节点将无法向IEF上报边缘节点状态,IEF会判定边缘节点故障,请保持边缘节点开机.
注意IEF并不会根据边缘节点收费的,而是依据边缘应用收费,边缘节点故障后,边缘应用仍以异常状态存在IEF中,仍会继续收费.
所以,如果您暂时不需要该服务,请确保在IEF中删除应用,而不是关机.
边缘节点本地容器引擎服务异常IEF的系统组件edgecore的启动和正常运行依赖容器引擎.
因此,如果容器引擎不正常,会导致edgecore组件无法启动.
解决方法:1.
使用dockerversion命令查看容器引擎是否正常.
如果不正常,可使用systemctlrestartdocker命令重启容器引擎;2.
使用dockerps命令查看容器引擎是否可以使用.
如果不可以,重新启动或安装容器引擎.
智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司2注意请勿强制下电边缘节点,强制下电可能会导致边缘节点上的数据文件丢失或损毁,从而导致节点故障.
边缘节点容器磁盘空间不足解决方法:1.
登录边缘节点.
执行如下命令查看当前边缘节点容器所挂载的磁盘空间使用情况.
df-h2.
删除边缘节点中的多余文件,释放磁盘空间.
rm文件名称边缘节点/opt/IEF磁盘空间不足解决方法:1.
登录边缘节点.
执行如下命令查看当前边缘节点/opt/IEF所挂载的磁盘空间使用情况.
df-h2.
删除边缘节点中的多余文件,释放磁盘空间.
rm文件名称边缘节点/var/IEF/sys/log磁盘空间不足解决方法:1.
登录边缘节点.
执行如下命令查看当前边缘节点/var/IEF/sys/log所挂载的磁盘空间使用情况.
df-h2.
删除边缘节点中的多余文件,释放磁盘空间.
rm文件名称边缘节点网络连接异常确认方法:1.
在边缘节点执行如下命令,获取连接IEF的地址.
cat/opt/IEF/Edge-core/conf/edge.
yaml|grepws-url回显类似以下结果.
ws-url:wss://ief2-edgeaccess.
cn-north-4.
myhuaweicloud.
com:443/其中ief2-edgeaccess.
cn-north-4.
myhuaweicloud.
com为需要获取的地址,不同区域地址不同.
2.
使用curl命令检查边缘节点与IEF网络是否能连接.
curl-i-v-khttps://ief2-edgeaccess.
cn-north-4.
myhuaweicloud.
com–如果一直没有回显,则说明边缘节点与IEF网络不通.
智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司3–如果回显如下,则说明网络正常.
*Abouttoconnect()toief2-edgeaccess.
cn-north-4.
myhuaweicloud.
comport443(#0)*Trying49.
4.
115.
239.
.
.
*Connectedtoief2-edgeaccess.
cn-north-4.
myhuaweicloud.
comport443(#0)*InitializingNSSwithcertpath:sql:/etc/pki/nssdb*skippingSSLpeercertificateverification*NSS:clientcertificatenotfound(nicknamenotspecified)*SSLconnectionusingTLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256*Servercertificate:*subject:OID.
1.
1.
1.
4=42701fe87611496e80c824778c9857ca,OID.
1.
1.
1.
3=op_svc_ief_container1:88125631e95e4d3fbdfa7e6ced0f9dd4,OID.
1.
1.
1.
2=cn-north-4:42701fe87611496e80c824778c9857ca:op_cfe_kubelet,OID.
1.
1.
1.
1=op_svc_ief_container1,CN=paas.
placement.
certs.
secretOSS3.
0CA,OU=OSS&ServiceToolsDept,O="HuaweiTechnologiesCo.
,Ltd",L=ShenZhen,ST=GuangDong,C=CN*startdate:Apr2916:00:002019GMT*expiredate:Apr2916:00:002049GMT*commonname:paas.
placement.
certs.
secretOSS3.
0CA>GET/HTTP/1.
1.
.
.
.
.
可能原因及解决方法:1.
域名解析问题.
执行如下命令.
pingief2-edgeaccess.
cn-north-4.
myhuaweicloud.
com看是否可以解析出IP,如果无法解析出IP,请执行如下命令查看域名解析服务器配置是否被修改.
cat/etc/resolv.
conf解决办法:–配置正确的域名解析服务器,推荐114.
114.
114.
114–获取正确的域名解析出来的IP,通过配置host文件临时规避2.
代理问题如果通过代理的方式,请确认是否配置代理,代理是否配置正确:–是否为节点配置了代理确认方法:env|grepproxyenv|grepPROXY–是否为edgecore配置代理确认方法:cat/opt/IEF/Cert/user_config|grepPROXY如果不是通过代理的方式,请务必通过以上方式确认没有配置代理.
3.
网络状态不稳确认边缘节点网络状态是否正常,是否存在网络不稳情况,如果出现网络不稳,会导致边缘节点的状态在故障和运行中两者之间不断跳动.
GPU驱动异常解决方法:步骤1正常安装GPU驱动.
智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司4IEF当前支持NvidiaTesla系列P4、P40、T4等型号GPU,支持CUDAToolkit8.
0至11.
0版本对应的驱动.
步骤2拷贝GPU驱动文件到指定目录.
1.
以root用户登录边缘节点.
2.
执行如下命令.
nvidia-modprobe-c0-u3.
创建文件夹.
mkdir-p/var/IEF/nvidia/drivers/var/IEF/nvidia/bin/var/IEF/nvidia/lib644.
拷贝驱动文件.
cp/lib/modules/{当前环境内核版本号}/kernel/drivers/video/nvi*/var/IEF/nvidia/drivers/cp/usr/bin/nvidia-*/var/IEF/nvidia/bin/cp-rd/usr/lib64/libcuda*/var/IEF/nvidia/lib64/cp-rd/usr/lib64/libEG*/var/IEF/nvidia/lib64/cp-rd/usr/lib64/libGL*/var/IEF/nvidia/lib64/cp-rd/usr/lib64/libnv*/var/IEF/nvidia/lib64/cp-rd/usr/lib64/libOpen*/var/IEF/nvidia/lib64/cp-rd/usr/lib64/libvdpau_nvidia*/var/IEF/nvidia/lib64/cp-rd/usr/lib64/vdpau/var/IEF/nvidia/lib64/其中,当前环境内核版本号可以使用uname-r命令查看获取,如下所示,请替换为实际取值.
#uname-r3.
10.
0-514.
e17.
x86_64----结束IEF在边缘节点的核心组件(edgecore)异常查看edgecore组件是否正常:systemctlstatusedgecore如果edgecore组件显示故障,可能包含以下原因:8883/1883端口被占用:请确认您的边缘节点8883端口和1883端口是否被占用,如果被占用,请先保证端口未被占用情况下,执行systemctlrestartedgecore恢复.
容器引擎状态异常:执行systemctlstatusdocker确认容器引擎是否正常,如果异常,请执行systemctlrestartdocker恢复.
防火墙原因:请参见11、8883端口被防火墙关闭.
边缘节点强行关机并之后强行开机,系统进入恢复模式如果您的边缘节点进行了强制下电关机以及强制开机强制重启,有一定的概率使您的系统进入恢复模式,请确认/opt/IEF目录是否正常,如果存在丢失,会导致IEF边缘节点故障智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司5确认方法:执行systemctlstatusedgecore显示服务状态异常,执行systemctlrestartedgecore可能会显示服务不存在执行systemctlstatusedgelogger显示状态异常,执行systemctlrestartedgelogger可能会显示服务不存在执行systemctlstatusedgemonitor显示状态异常,执行systemctlrestartedgemonitor可能会显示服务不存在恢复方法:请确保您的机器开机时是已正常模式进入的.
另外,边缘节点异常下电极有可能会造成文件损坏或者丢失,请避免执行该类操作,如出现该问题,请提交工单.
1.
2边缘节点有哪些故障场景边缘节点有如下故障场景:容器引擎故障,包括容器引擎未启动和容器引擎服务异常节点磁盘空间不足边缘节点网络连接异常GPU驱动异常1.
3边缘节点纳管失败如何处理问题描述边缘节点纳管失败.
问题排查边缘节点纳管失败的原因众多,大部分是因为边缘节点不满足纳管要求或网络不通导致的,请根据如下原因排查.
图1-1排查思路智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司6您可以使用edgectl检查边缘节点是否满足纳管要求,检查"/opt/edge-installer"目录下是否存在edgectl文件.
如果存在,则无需下载.
如果不存在,请登录IEF控制台,在总览页面右侧的"边缘运维工具"中下载对应版本工具,例如"edgectl_x.
x.
x_x_x86_64.
tar.
gz",并解压安装包到"/opt/edge-installer"目录下.
执行如下命令检查边缘节点是否满足纳管要求.
chmod+x/opt/edge-installer/edgectl.
/opt/edge-installer/edgectldiagnoseinstallation如果边缘节点不满足要求,则返回如下信息.
您可以根据错误码定位解决对应问题,详细信息请参见错误码总览.
FailedtogetDockerversion.
ERROR6102:MakesurethatDockerisrunning.
Formoreinformation,seeIEFdocumentation.
|Installationdiagnosefailed.
|如果边缘节点满足要求,则返回如下信息.
此时您可以根据表1-2手动排查故障.
|Installationdiagnosesucceed.
|表1-2排查思路可能原因处理措施边缘节点不满足纳管要求1、边缘节点不满足纳管要求2、操作系统不支持3、操作系统内核版本过低,部分命令不存在而导致边缘节点安装失败4、获取边缘节点操作系统失败5、AI加速卡类型的边缘节点未安装NPU驱动6、GPU类型边缘节点未安装GPU驱动7、目录磁盘满导致安装失败Docker相关问题8、容器引擎未安装或未启动9、边缘节点存在多个docker0网桥地址网络相关问题10、8883端口被占用11、8883端口被防火墙关闭12、边缘节点无法连接IEF13、边缘节点域名解析异常其他问题14、同一个证书重复在多个边缘节点使用15、同一边缘节点多次进行纳管16、纳管边缘节点的命令没有在对应目录下执行智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司71、边缘节点不满足纳管要求目前在边缘节点安装EdgeAgent对系统有一定的要求,请检查是否满足表1-3所示要求.
表1-3边缘节点要求项目规格OSx86_64架构Ubuntu16.
04LTS(XenialXerus)、Ubuntu18.
04LTS(BionicBeaver)、CentOS7.
x和RHEL7.
x、银河麒麟4.
0.
2、中兴新支点v5.
5、中标麒麟v7.
0armv7i(arm32)架构RaspbianGNU/Linux9(stretch)aarch64(arm64)架构Ubuntu18.
04.
2LTS(BionicBeaver)内存边缘软件开销约128MB,为保证业务的正常运行,建议边缘节点的内存大于256MB.
CPU>=1核硬盘>=1GBGPU(可选)同一个边缘节点上的GPU型号必须相同.
说明当前支持NvidiaTesla系列P4、P40、T4等型号GPU.
含有GPU硬件的设备,作为边缘节点的时候可以不使用GPU.
如果边缘节点使用GPU,您需要在纳管前安装GPU驱动.
NPU(可选)华为昇腾AI加速处理器.
说明当前仅支持集成了华为昇腾310芯片的设备,如Atlas300推理卡、Atlas500智能小站、Atlas800推理服务器.
如果边缘节点使用NPU,请确保设备已安装驱动.
如果没有安装驱动,请联系厂商获取支持.
容器引擎(使用容器应用的场景必选)Docker版本必须高于17.
06,推荐使用18.
06.
3版本.
(请勿使用18.
09.
0版本Docker,该版本存在严重bug,详见https://github.
com/docker/for-linux/issues/543;如果已使用此版本,请尽快升级.
Atlas500小站预置的Docker18.
09.
0.
60软件版本已经修改该问题.
)须知Docker安装完成后,请将Docker进程配置为开机启动,避免系统重启后Docker进程未启动引起的系统异常.
互联网协议必须支持IPv6协议.
glibc版本必须高于2.
17.
智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司8项目规格端口使用边缘节点需要使用如下端口,请确保这些端口能够正常使用.
8102:边缘节点日志上报至应用运维管理(ApplicationOperationsManagement,AOM)服务8149:边缘节点监控上报至AOM8065:边缘节点告警上报至AOM443:边缘节点连接IEF8883:内置MQTTBroker使用的端口1883:外置MQTTBroker使用的端口20004:边缘节点上报消息到DIS时间同步边缘节点时间需要与UTC标准时间保持一致,否则会导致边缘节点的监控数据、日志上传出现偏差.
您可以选择合适的NTP服务器进行时间同步,从而保持时间一致.
详细配置方法请参见如何同步NTP服务器.
2、操作系统不支持请参见表1-3查看您的操作系统是否为IEF支持操作系统,注意不要使用中文版的linux操作系统.
3、操作系统内核版本过低,部分命令不存在而导致边缘节点安装失败首先,请参照表1-3中对边缘节点的要求,查看您的操作系统及内核版本是否符合要求.
执行以下命令确认是否存在操作系统内核版本过低情况:sh/opt/edge-installer/conf/script/parse_user_config.
shnode_id如果命令报错,则说明操作系统内核版本过低,请升级您的内核版本或重装新版操作系统后再重新纳管边缘节点.
4、获取边缘节点操作系统失败查看安装输出日志,如下最后一行,os字段如果为空,说明获取操作系统信息失败.
2020-01-1117:00:46.
341+08:00DEBUG:0initlogger.
.
.
2020-01-1117:00:46.
341+08:00INFOconfig/config.
go:45Newfilesourceaddedforconfiguration:/opt/edge-installer/conf/config.
yaml2020-01-1117:00:46.
341+08:00INFOconfig/config.
go:45Newfilesourceaddedforconfiguration:/opt/edge-installer/conf/logging.
yaml2020-01-1117:00:46.
351+08:00INFOpkg/installer.
go:24starttoinstall2020-01-1117:00:46.
386+08:00INFOplacementclient/placementclient.
go:61http_proxy:ProxyNotSet,https_proxy:ProxyNotSet2020-01-1117:00:46.
437+08:00INFOhttpclient/httpsclient.
go:182https_proxy:2020-01-1117:00:46.
479+08:00INFOutil/util.
go:446systemcertfile[/opt/IEF/Cert/system/sys_private_cert_crypto.
crt]andsystemkeyfile[/opt/IEF/Cert/system/sys_private_cert_crypto.
key]havebeeninited2020-01-1117:00:46.
479+08:00INFOpkg/installer.
go:46install-2020-01-1117:00:46.
479+08:00INFOdeploy/bootstrap.
go:48installprechecksuccess.
2020-01-1117:00:46.
479+08:00INFOdeploy/bootstrap.
go:54installpreprocessstart智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司92020-01-1117:00:46.
479+08:00INFOdeploy/deploy.
go:39installpreprocessstart2020-01-1117:00:46.
501+08:00INFOutil/util.
go:192getarchsuccess2020-01-1117:00:46.
502+08:00INFOutil/util.
go:216ostypeis:"euleros"2020-01-1117:00:46.
502+08:00INFOutil/util.
go:432installerversion[1.
0.
6]2020-01-1117:00:46.
516+08:00INFOplacementclient/placementclient.
go:113body:{"arch":"x86_64","installer_version":"1.
0.
6","os":"euleros"}5、AI加速卡类型的边缘节点未安装NPU驱动如果您在注册边缘节点时选了AI加速卡类型的边缘节点,边缘节点必须支持NPU,并且确保您安装了NPU驱动.
在您的边缘节点执行以下命令:ls/dev/davinci_manager/dev/hisi_hdc/dev/davinci*如果文件不存在,说明您没有安装NPU驱动,请确认安装NPU驱动.
6、GPU类型边缘节点未安装GPU驱动步骤1正常安装GPU驱动.
IEF当前支持NvidiaTesla系列P4、P40、T4等型号GPU,支持CUDAToolkit8.
0至11.
0版本对应的驱动.
步骤2拷贝GPU驱动文件到指定目录.
1.
以root用户登录边缘节点.
2.
执行如下命令.
nvidia-modprobe-c0-u3.
创建文件夹.
mkdir-p/var/IEF/nvidia/drivers/var/IEF/nvidia/bin/var/IEF/nvidia/lib644.
拷贝驱动文件.
cp/lib/modules/{当前环境内核版本号}/kernel/drivers/video/nvi*/var/IEF/nvidia/drivers/cp/usr/bin/nvidia-*/var/IEF/nvidia/bin/cp-rd/usr/lib64/libcuda*/var/IEF/nvidia/lib64/cp-rd/usr/lib64/libEG*/var/IEF/nvidia/lib64/cp-rd/usr/lib64/libGL*/var/IEF/nvidia/lib64/cp-rd/usr/lib64/libnv*/var/IEF/nvidia/lib64/cp-rd/usr/lib64/libOpen*/var/IEF/nvidia/lib64/cp-rd/usr/lib64/libvdpau_nvidia*/var/IEF/nvidia/lib64/cp-rd/usr/lib64/vdpau/var/IEF/nvidia/lib64/其中,当前环境内核版本号可以使用uname-r命令查看获取,如下所示,请替换为实际取值.
#uname-r3.
10.
0-514.
e17.
x86_64----结束7、目录磁盘满导致安装失败请执行如下命令.
智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司10df-hlsblk确保如下目录磁盘使用率未接近100%.
磁盘大小要求请参见表1-3.
/opt/IEF/opt/edge-installer/opt/IEFpack/var/IEF8、容器引擎未安装或未启动执行以下命令确认容器引擎是否启动.
systemctlstatusdocker如果没有容器引擎的信息,说明容器引擎未安装,请参考表1-3中的要求安装容器引擎.
如果容器引擎未启动,执行以下命令尝试启动容器引擎.
systemctlrestartdocker再次查看容器引擎状态.
–如果容器引擎启动正常,请重新纳管边缘节点.
–如果容器引擎是否无法正常启动,请优先恢复容器引擎,或者重新安装容器引擎.
9、边缘节点存在多个docker0网桥地址使用了容器引擎图形化界面的容器后,产生了两个docker0网桥地址,导致IEF服务纳管过程中docker0网桥注册失败导致安装失败,删除多余的docker0网桥后重新安装可解决问题.
执行以下命令:ipaddrshow|grepdocker0如果出现多个IP,说明存在多个docker0网桥,请保留172开头的IP,删除多余的docker0网桥地址.
10、8883端口被占用执行以下命令查看8883端口是否被占用.
netstat-npl|grep8883如果端口被占用,将会导致IEF核心组件安装失败,因为IEF核心组件edgecore正常运行依赖该端口.
当IEF被正常安装后,8883将被edgecore组件监听,如下图,所以务必保证8883端口未被占用.
智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司1111、8883端口被防火墙关闭检查边缘节点防火墙状态.
systemctlstatusfirewalldfirewall-cmd--state回显中,notrunning表示关闭,running表示开启.
如果防火墙开启,您需要打开8883端口,或关闭防火墙.
打开8883端口.
firewall-cmd--add-port=8883/tcp--permanentsystemctlrestartfirewalld关闭防火墙.
systemctldisablefirewalldsystemctlstopfirewalld12、边缘节点无法连接IEF执行如下命令,确认边缘节点是否能连接IEF.
curl-i-k-vhttps://ief2-edgeaccess.
cn-north-4.
myhuaweicloud.
com:443/如果一直没有回显,则说明边缘节点与IEF网络不通,请确保边缘节点能连接IEF.
13、边缘节点域名解析异常请确保您的边缘节点可以解析以下域名:ief2-placement.
cn-north-4.
myhuaweicloud.
com(依据不同的局点,域名不同,例如北京一为ief2-placement.
cn-north-1.
myhuaweicloud.
com,可以通过cat/opt/IEF/Cert/user-config来查找对应的域名)ief2-edgeaccess.
cn-north-4.
myhuaweicloud.
com确认命令.
pingief2-edgeaccess.
cn-north-4.
myhuaweicloud.
compingief2-placement.
cn-north-4.
myhuaweicloud.
com如果域名无法解析请配置合适的域名解析服务器,建议配置"114.
114.
114.
114".
14、同一个证书重复在多个边缘节点使用同一个证书重复在多台机器纳管(同一套证书在不同的边缘节点上注册,且有一台边缘节点处于正常运行状态)在IEF界面注册的边缘节点和实际的边缘节点一一对应,请避免只在IEF界面创建一个边缘节点,下载安装包和证书后,重复在多个边缘节点上纳管时使用.
执行如下命令查看是否重复使用证书:cat/var/IEF/sys/log/edge_core.
log|grepwebsocket查看edge_core.
log会提示node_id已被占用,如下图所示.
智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司1215、同一边缘节点多次进行纳管之前纳管后未正确执行卸载操作(边缘节点以前纳管过,在IEF界面删除边缘节点后,未在边缘节点上卸载)执行以下命令确认节点上以下组件是否处于运行状态:systemctlstatusedgecoresystemctlstatusedgemonitorsystemctlstatusedgelogger如果边缘节点纳管失败,但执行以上命令发现组件仍然处于运行状态,说明之前纳管的组件未正常卸载,请执行以下命令卸载.
cd/opt/edge-installer;sudo.
/installer-op=uninstall注意,存在以下错误情况:重新纳管边缘节点时,直接将原来的节点的"/opt"目录变为"/opt_old"目录,新建"/opt"目录,后按照IEF提供的指导进行纳管.
纳管失败后,执行卸载操作,提示卸载成功,但实际上执行以上命令发现对应组件仍然处于运行状态.
这是因为在执行以上卸载操作时,卸载的不是"/opt_old"中安装的IEF组件.
如遇该种情况,请先将"/opt"目录恢复,执行卸载操作后再重新开始纳管.
请尽量避免该类操作.
之前纳管的组件卸载不干净如果您确认卸载完成,但纳管仍然失败,请重启边缘节点后重试纳管.
16、纳管边缘节点的命令没有在对应目录下执行安装命令为:cd/opt/edge-installer;sudo.
/installer-op=install请注意不要忽略cd/opt/edge-installer;命令,确保执行安装命令是在edge-installer目录下执行.
1.
4GPU驱动安装错误如何处理故障现象执行nvidia-gpu-installer.
sh脚本安装GPU驱动时报错,如下所示.
智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司13原因分析nouveau是一个显卡驱动程序,存在于大多数Linux操作系统.
该驱动程序与NVIDIA驱动程序冲突,需要在安装前禁用该程序.
解决办法如下是以Ubuntu16.
04禁用nouveau的方法,其它版本操作系统可自行搜索解决方案.
1.
打开/etc/modprobe.
d/blacklist-nouveau.
conf文件.
sudogedit/etc/modprobe.
d/blacklist.
conf输入密码后,加入一行(将Ubuntu自带的显卡驱动加入黑名单).
blacklistnouveau2.
执行以下命令使禁用nouveau生效.
sudoupdate-initramfs-u3.
重启操作系统.
sudoreboot4.
执行如下命令停止lightdm服务.
sudoservicelightdmstop5.
执行如下命令,检查是否禁用成功.
lsmod|grepnouveau如无回显,则表示禁用成功1.
5设备属性更新后,在容器内可以获取最新的设备属性么1.
如果设备属性是通过环境变量的方式写入到容器镜像里面的,那就需要更新容器的环境变量内容,并重新下发容器才能生效,这种方式不灵活,不推荐使用.
2.
如果用户是通过IEF提供的API接口方式获取的设备,那么可以在app内通过使用查询边缘设备详情的接口获取最新的设备内容.
请参见查询边缘设备详情.
智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司141.
6设备与节点绑定以后,能用来做什么1.
创建设备以后,用户可以在业务应用中通过设备接口查询到相应的设备信息,更加方便了业务容器对设备信息的获取.
2.
设备关联节点以后,可以通过创建和更新设备孪生的属性内容,从而达到云上直接控制设备的效果.
1.
7边缘节点支持多个显卡么支持同一类型的多个显卡.
1.
8正在运行中的边缘节点可以更换显卡么可以,请按如下步骤操作:1.
停止IEFagent服务.
systemctlstopedgecoresystemctlstopedgedaemon2.
更换显卡,重新安装显卡驱动,然后拷贝驱动文件,具体请参见拷贝GPU驱动文件.
3.
启动边缘agent服务.
systemctlstartedgecoresystemctlstartedgedaemon1.
9边缘环境的安全是怎么解决的IEF提供云边协同的安全解决方案.
IAM认证通过创IAM角色,允许从边缘节点访问AOM、SWR、DIS等华为云资源.
边缘节点安全EdgeAgent创建专属服务用户,能够访问的目录和拥有的权限都受限,向云端上传日志、监控信息由用户自行选择.
云边协同通讯安全EdgeAgent与IEF建立双向加密通道,EdgeAgent自下向上发起,双向消息收发通过证书认证、加密.
云安全前置DDOS网络安全防护,防恶意攻击.
为每个边缘节点颁布唯一接入证书,双向通讯通过证书认证、加密.
设备安全边缘设备使用证书进行身份认证.
智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司15图1-2IEF安全性方案1.
10边缘节点查看不到监控数据的原因原因分析用户没有为智能边缘平台建委托角色或没有在边缘计算组设置委托,因此IEF服务不能将边缘设备的监控数据上报到应用运维服务(AOM),从而导致边缘节点的监控界面没有数据.
解决方法步骤1为智能边缘平台创建委托角色.
1.
在用户首次进入界面是系统会自动弹出创建委托界面.
2.
单击"同意授权"则平台会自动创建委托.
智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司16图1-3自动创建委托步骤2用户在智能边缘平台创建节点时则会自动配置委托.
----结束1.
11边缘节点被删除后如何恢复,是只需要再纳管一次,还是要重新注册需要重新注册边缘节点,具体步骤请参见注册边缘节点.
1.
12边缘节点IP地址变化会有什么影响IEF识别边缘节点的唯一标识是节点ID.
边缘节点纳管后,边缘节点会定期向IEF上报边缘节点的状态等信息,会将节点的IP地址等信息同步到IEF,所以边缘节点IP地址变化不会产生任何影响.
1.
13NTP无法修改时如何处理很可能是边缘节点未启动ntpd进程,在边缘节点上执行systemctlrestartntpd命令后可以解决该问题.
1.
14如何同步NTP服务器背景信息使用IEF时,您的边缘节点时间需要与UTC标准时间保持一致,否则会导致边缘节点的监控数据、日志上传出现偏差.
您可以选择合适的NTP服务器进行时间同步,从而保持时间一致.
智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司17前提条件边缘节点上需要安装NetworkTimeProtocoldaemon(ntpd).
例如在CentOS上可以执行yuminstall-yntp命令安装ntpd.
操作步骤步骤1登录Linux弹性云服务器.
步骤2执行以下命令,编辑ntp.
conf文件.
vim/etc/ntp.
conf步骤3添加以下语句,配置NTP服务器.
serverNTP服务器域名示例:server0.
pool.
ntp.
org步骤4执行以下命令,系统重新启动时启动服务.
对于SUSE操作系统:servicentprestart对于CentOS操作系统:systemctlrestartntpd说明请根据弹性云服务器实际使用的操作系统,选择具体的命令进行重启.
步骤5执行以下命令,检查与上层NTP服务器是否时钟同步成功.
ntpq-p如果出现"*",则表示时钟同步成功.
说明首次进行NTP时钟同步需要一定时间,请等待几分钟再进行检查.
步骤6执行以下命令,设置NTP服务开机自启动.
如果是SUSE操作系统:chkconfigntpon如果是CentOS操作系统:chkconfigntpdon----结束智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司181.
15如何获取IEF云端服务IP地址边缘节点纳管时,需要与IEF、SWR和OBS三个服务通信.
如果您的边缘节点所在环境有防火墙,可根据表1-4中域名获取IP地址,然后使用IP地址和端口配置防火墙,使得边缘节点能够访问IEF、SWR和OBS.
域名对应的IP地址可通过PING命令获取,如下所示.
$pingief2-placement.
cn-north-4.
myhuaweicloud.
com正在Pingief2-placement.
cn-north-4.
myhuaweicloud.
com[119.
3.
227.
164]具有32字节的数据:表1-4边缘节点访问域名区域域名端口华北-北京一ief2-placement.
cn-north-1.
myhuaweicloud.
com443ief2-edgeaccess.
cn-north-1.
myhuaweicloud.
com443ief2-telemetry.
cn-north-1.
myhuaweicloud.
com8102、8149、8065swr.
cn-north-1.
myhuaweicloud.
com443obs.
cn-north-1.
myhuaweicloud.
com443ief-agent-software.
obs.
cn-north-1.
myhuaweicloud.
com443华北-北京四ief2-placement.
cn-north-4.
myhuaweicloud.
com443ief2-edgeaccess.
cn-north-4.
myhuaweicloud.
com443ief2-telemetry.
cn-north-4.
myhuaweicloud.
com8102、8149、8065swr.
cn-north-4.
myhuaweicloud.
com443obs.
cn-north-4.
myhuaweicloud.
com443ief-software-north-4.
obs.
cn-north-4.
myhuaweicloud.
com443华南-广州ief-placement.
cn-south-1.
myhuaweicloud.
com443ief-edgeaccess.
cn-south-1.
myhuaweicloud.
com443ief-telemetry.
cn-south-1.
myhuaweicloud.
com8102、8149、8065智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司19区域域名端口swr.
cn-south-1.
myhuaweicloud.
com443obs.
cn-south-1.
myhuaweicloud.
com443ief-software-south-1.
obs.
cn-south-1.
myhuaweicloud.
com443华东-上海一ief-placement.
cn-east-3.
myhuaweicloud.
com443ief-edgeaccess.
cn-east-3.
myhuaweicloud.
com443ief-telemetry.
cn-east-3.
myhuaweicloud.
com8102、8149、8065swr.
cn-east-3.
myhuaweicloud.
com443obs.
cn-east-3.
myhuaweicloud.
com443ief-software-east-3.
obs.
cn-east-3.
myhuaweicloud.
com443华东-上海二ief2-placement.
cn-east-2.
myhuaweicloud.
com443ief2-edgeaccess.
cn-east-2.
myhuaweicloud.
com443ief2-telemetry.
cn-east-2.
myhuaweicloud.
com8102、8149、8065swr.
cn-east-2.
myhuaweicloud.
com443obs.
cn-east-2.
myhuaweicloud.
com443ief-software-east-2.
obs.
cn-east-2.
myhuaweicloud.
com443智能边缘平台常见问题1边缘节点文档版本01(2021-02-20)版权所有华为技术有限公司202边缘应用2.
1下发应用到边缘节点失败问题描述应用无法下发到边缘节点.
排查思路以下排查思路根据原因的出现概率进行排序,建议您从高频率原因往低频率原因排查,从而帮助您快速找到问题的原因.
图2-1排查思路表2-1排查思路可能原因处理措施边缘节点故障登录IEF,选择"边缘资源>边缘节点",确认边缘节点是否故障,如果故障请参见1.
1边缘节点故障如何处理边缘节点不满足下发要求边缘节点不满足下发要求边缘节点资源不足边缘节点资源不足容器镜像拉取失败请参见2.
4容器镜像拉取失败.
智能边缘平台常见问题2边缘应用文档版本01(2021-02-20)版权所有华为技术有限公司21边缘节点不满足下发要求确认边缘节点资源信息是否正确.
步骤1如果边缘节点需要使用NPU、GPU等资源.
1.
如果边缘应用需要使用NPU、GPU资源,请确认注册和纳管的边缘节点是否选择了对应的类型.
2.
在边缘节点通过dockerps命令查看NPU、GPU容器(npu-device-plugin、gpu-device-plugin)是否正常运行.
如果您是首次纳管节点,请参见2.
2容器应用在边缘节点启动失败处理.
3.
确认边缘节点是否已经有应用使用了GPU、NPU资源,节点是否还有剩余资源.
步骤2确认IEF控制台上显示的边缘节点规格是否正确,CPU和内存信息是否有正常显示,如果内存显示为0,请确认边缘节点是否使用了中文版的操作系统,IEF服务仅支持英文版操作系统,中文版操作系统因无法有效获取内存信息从而会导致下发应用无法调度.
因此需要您重装操作系统重新纳管节点.
注意重装前请确保您下载的安装包和证书文件已经保存,如果未保存,请将边缘节点删除后,重新注册新的边缘节点.
步骤3如果您要下发的是容器应用,请确认您的边缘节点是否启用了容器引擎,如果未启用容器引擎,您将无法下发容器应用.
----结束边缘节点资源不足步骤1查看容器异常的原因.
将您的鼠标放在实例状态附近,查看应用下发失败原因.
智能边缘平台常见问题2边缘应用文档版本01(2021-02-20)版权所有华为技术有限公司22步骤2确认应用申请的资源大小.
确认边缘节点可用资源是否满足应用申请的资源量,确保边缘节点资源足够.
应用申请资源量确认参考下图.
----结束2.
2容器应用在边缘节点启动失败问题描述容器应用在边缘节点启动失败.
智能边缘平台常见问题2边缘应用文档版本01(2021-02-20)版权所有华为技术有限公司23排查思路以下排查思路根据原因的出现概率进行排序,建议您从高频率原因往低频率原因排查,从而帮助您快速找到问题的原因.
图2-2排查思路表2-2排查思路可能原因处理措施容器应用下发到边缘节点失败请参见2.
1下发应用到边缘节点失败容器应用配置不正确容器应用配置不正确容器镜像无法下载到边缘节点请参见2.
4容器镜像拉取失败.
容器应用配置不正确步骤1登录边缘节点.
步骤2执行如下命令查看容器是否处于运行状态.
sudodockerps|grep应用名称执行如下命令查看容器是否处于异常退出状态.
sudodockerps-a|grep应用名称多次交替执行上面两个命令,确认容器是否一直在重启.
如果您无法查到您的应用,请参见步骤3.
如果您的容器在不断重启,请对以下情况进行自查:ID=`sudodockerps-a|grep应用名称|awk'{print$1}'`sudodockerlogs$ID该日志为应用日志,所以请通过该日志定位容器不断重启的原因,可参考以下几种情况考虑–镜像问题镜像本身存在错误,无法正常启动,或者镜像与系统不匹配,导致无法启动.
您可以通过以下方式在边缘节点验证:i.
获取边缘节点镜像.
dockerimages智能边缘平台常见问题2边缘应用文档版本01(2021-02-20)版权所有华为技术有限公司24ii.
查找到您的镜像,并获取镜像ID.
iii.
通过dockerrun命令运行容器,根据业务需求,可能需要不同的启动命令.
–启动参数问题请确认启动参数是否正确.
–目录挂载问题如果镜像需要使用节点上特殊的目录,请确认该目录在下发时已经挂载.
–NPU问题如果您的应用需要使用NPU等资源,请确认您在应用下发时,选择了该资源.
NPU资源被非IEF下发的应用占用,导致资源不足.
IEF不能识别非IEF应用对NPU的占用情况,请确定NPU资源是否充足.
–资源问题请确认应用下发时申请的CPU/内存等资源的limit值足够您的应用启动(存在limit值过小,容器运行所需资源较多,导致容器不断被kill的情况).
您可以通过更新升级调大limit值验证.
–健康检查问题如果您配置了健康检查,请确认健康检查方式配置正确.
如果您的健康检查方式配置错误,会导致健康检查不断失败,容器不断被重启.
登录IEF界面=》边缘应用=》选择您的应用=》单击更新升级=》高级配置=》健康检查=》确认您的应用存活探针和应用业务探针是否配置正确.
为验证该问题,您可以通过暂时不配置健康检查,更新升级后,看应用会不会继续不断重启.
–健康检查时间间隔问题请确认应用正常启动需要多长时间,以及您配置的健康检查方式一般多长时间可以返回结果.
健康检查的延迟时间是指应用下发后多长时间开始健康检查,如果健康检查延迟时间配置过小,应用还不能正常启动,会导致健康检查不断失败,容器不断被重启,从而形成恶性循环.
智能边缘平台常见问题2边缘应用文档版本01(2021-02-20)版权所有华为技术有限公司25健康检查的超时时间是指发起健康检查请求后多长时间不反馈判定健康检查失败.
如果配置的健康检查超时时间小于接口返回所需时间,会导致健康检查不断失败,从而应用被不断重启.
(在边缘节点性能不佳或者边缘应用业务量很大的情况下,容易出现该问题)步骤3确认应用是否下发成功.
1.
切换至root用户.
sudosu2.
查看应用日志.
cat/var/IEF/sys/log/edge_core.
log|grep应用名称如果有日志输出,说明应用下发成功,可能是容器镜像未能成功拉取,请参见2.
4容器镜像拉取失败定位.
如果无日志输出,请提交工单.
----结束2.
3容器应用升级失败问题描述在IEF控制台升级容器应用后,边缘节点无任何反应,升级失败.
排查思路以下排查思路根据原因的出现概率进行排序,建议您从高频率原因往低频率原因排查,从而帮助您快速找到问题的原因.
图2-3排查思路1.
可能原因一:升级消息未下发.
解决方法请参考重启edgecore.
2.
可能原因二:节点网络不稳定,应用处于terminating状态.
请在IEF控制台删除该应用,然后重新创建应用.
3.
可能原因三:应用触发删除,但删除失败,再次触发升级会导致无法升级.
请在IEF控制台删除该应用,然后重新创建应用.
重启edgecore登录边缘节点,执行如下命令重启edgecore进程.
systemctlrestartedgecore智能边缘平台常见问题2边缘应用文档版本01(2021-02-20)版权所有华为技术有限公司26提交工单如果上述方法均不能解决您的疑问,请提交工单.
2.
4容器镜像拉取失败问题描述SWR的容器镜像无法拉取到边缘节点.
排查思路容器镜像拉取失败主要原因如图2-4所示,在此基础上,您可以根据表2-3逐步排查.
图2-4排查思路表2-3排查思路可能原因处理措施镜像地址错误镜像地址错误没有镜像拉取权限没有镜像拉取权限边缘节点无法解析SWR和OBS域名边缘节点无法解析SWR和OBS的域名边缘节点无法连接SWR边缘节点无法连接SWR磁盘空间不足磁盘空间不足镜像过大而带宽不足镜像过大而带宽不足容器引擎异常容器引擎异常智能边缘平台常见问题2边缘应用文档版本01(2021-02-20)版权所有华为技术有限公司27镜像地址错误执行如下确认镜像地址是否正确,如不正确请替换为正确的地址.
1.
登录容器镜像服务控制台.
2.
在左侧菜单栏选择"我的镜像",单击右侧镜像名称.
3.
在镜像详情页面中,单击对应镜像版本"下载指令"列的复制图标,复制镜像下载地址.
没有镜像拉取权限获取登录指令并登录,尝试拉取镜像.
如果无法登录或无法拉取镜像,则说明无权限.
边缘节点无法解析SWR和OBS的域名检查SWR和OBS的域名是否能解析.
SWR镜像拉取不仅要可以访问SWR,同时也要可以访问OBS,因为SWR镜像实际存储在OBS中.
请确认您的节点是否可以解析SWR和OBS的域名,如果域名无法解析,将会导致镜像拉取失败.
验证方案1:在边缘节点上查看日志:cat/var/IEF/sys/log/edge_core.
log|greplookup验证方案2:在边缘节点上执行如下命令pingswr.
cn-north-4.
myhuaweicloud.
com智能边缘平台常见问题2边缘应用文档版本01(2021-02-20)版权所有华为技术有限公司28pingobs.
cn-north-4.
myhuaweicloud.
com看是否可以解析出IP,看是否可以解析域名,如果在边缘节点上域名可以解析,但是登录SWR镜像仓库一直卡住,请确认您的容器引擎的域名解析方式如何配置的.
如果无法解析出IP,请执行如下步骤查看域名解析服务器配置是否被修改.
–如果配置了本地hosts的做域名与IP地址的映射,请检查配置是否正确.
cat/etc/hosts|grepswrcat/etc/hosts|grepobs请在环境正确的机器上解析出正确IP后配置,若配置错误会导致域名解析错误.
–如果您是通过/etc/resolv.
conf文件配置的域名解析服务器来解析域名,请确认配置的域名解析服务器是否正确,该域名解析服务器是否可以解析这两个域名注意:如果通过公网访问IEF和容器引擎,中国大陆DNS解析服务器一般设置为114.
114.
114.
114.
并且确认您的域名解析服务器配置正确,可以再有效时间内解析到域名.
如果配置多个域名解析服务器(其中包含114.
114.
114.
114),但容器引擎仍然无法解析域名,建议注释其他域名解析服务器,只留114.
114.
114.
114尝试.
–是否配置了代理,代理服务器是否可以解析这两个域名为你的边缘节点同时开两个终端.
在一个终端上保持:pingswr.
cn-north-4.
myhuaweicloud.
com在另外一个终端抓包:tcpdump-nn-ieth0udpport53确认使用域名解析服务器的顺序,域名解析情况,最终通过那个域名解析服务器解析出域名(如果配置了hosts文件,不会进行域名解析).
在一个终端上保持:dockerloginXXX(在SWR复制的临时登录命令)在另外一个界面抓包:tcpdump-nn-ieth0udpport53确认使用域名解析服务器的顺序,域名解析情况,最终通过那个域名解析服务器解析出域名(如果配置了hosts文件,不会进行域名解析)确认上面两步域名解析服务器使用是否一致,域名是否可以解析,请保证您的机器可以在有效时间内解析SWR和OBS的域名,您可以修改/etc/resolv.
conf文件并配置hosts文件.
边缘节点无法连接SWR步骤1检查边缘节点到SWR的网络是否能连接.
在边缘节点上:curl-i-k-vwww.
baidu.
comcurl-i-k-vswr.
cn-north-4.
myhuaweicloud.
comcurl-i-k-vobs.
cn-north-4.
myhuaweicloud.
com说明不同局点域名不同.
智能边缘平台常见问题2边缘应用文档版本01(2021-02-20)版权所有华为技术有限公司29看边缘节点网络是否连通,如果网络不通,请确认您的网络策略,是否可以连接外网.
如果边缘节点测试网络连通,但是执行dockerlogin命令会卡住,请再次依据边缘节点无法解析SWR和OBS的域名确认SWR的域名解析问题.
如果您确认域名可以解析,请依据您为边缘节点设定的访问外网方式,确认您的容器可以访问外网.
确认以下问题:1.
确认是否为节点配置了代理env|grepproxyenv|grepPROXY2.
确认是否为容器引擎配置了代理systemctlshow--property=Environmentdocker如果使用代理访问外网,请确认你的节点和容器引擎的代理配置正确.
步骤2尝试再次登录并下载镜像.
如果显示鉴权失败,请提交工单.
----结束磁盘空间不足节点磁盘不足导致镜像拉取失败(磁盘问题)df-h查看节点磁盘你空间(/var/lib/docker/*),对比您的镜像的大小(一般镜像大小要比SWR界面显示要大),您的磁盘剩余空间是否可以下载镜像成功.
如果节点空间不足,镜像拉取过程中会明确报错镜像过大而带宽不足请确认镜像的大小以及外网带宽,看是否会导致镜像下载超时.
例如:镜像大小为1G,而边缘节点的下载速度约200k/s.
则下载时长约为:1024M/0.
2M=5129S=85.
3min.
远超一个应用正常下发时长,因此应用无法下载成功.
针对这类问题,建议您首先将镜像下载至边缘节点后,再下发应用,省去下载步骤.
容器引擎异常如果执行dockerpull触发容器引擎本身报错,由于容器引擎为用户自装软件,各用户安装版本等各不相同,不同的版本的容器引擎都可能存在一些性能缺陷,为快速解决问题,您可优先在网上查找容器引擎报错.
您可以尝试通过重启容器引擎规避问题:systemctlrestartdocker另外,建议您使用IEF建议您安装的稳定版本的容器引擎,容器引擎版本要求请参见使用要求.
智能边缘平台常见问题2边缘应用文档版本01(2021-02-20)版权所有华为技术有限公司302.
5为什么看不到应用日志和系统日志边缘节点上报应用日志和系统日志需要打开日志开关,且边缘节点的NTP与华为云一致.
如果看不到日志,可能有如下原因:1.
日志开关未打开.
请到登录IEF控制台,选择"边缘节点",进入边缘节点详情页,在"配置"页签下找到"日志配置",将日志开关打开.
2.
边缘节点的时区设置有问题.
修改边缘节的NTP服务器设置,保持与华为云一致.
详细可以参考如何在弹性云服务器上安装NTP服务器.
2.
6怎么知道函数有没有正确执行查看函数状态,函数状态为运行中,函数得到了正确的执行.
2.
7函数启动失败的原因现象函数启动失败,状态为错误.
原因分析1.
端侧未有相对应的函数启动环境(当前启动环境包含python2.
7,python3.
6)2.
函数代码存在问题,在调用的时候编译失败.
3.
函数执行出现了异常,导致失败.
解决方法1.
安装函数运行时环境.
智能边缘平台常见问题2边缘应用文档版本01(2021-02-20)版权所有华为技术有限公司312.
检视代码,检查是否有编译错误.
3.
查看对接到应用监控的函数启动日志,日志名为python***.
log,查看具体的错误信息.
2.
8为什么需要使用nvidia-gpu-installer.
sh安装GPU驱动这种方式和在操作系统上直接安装GPU驱动有什么不同1.
纳管IEF边缘节点前,必须使用IEF提供的nvidia-gpu-installer.
sh驱动安装脚本安装对应版本的驱动,如果当前操作系统已经安装了GPU驱动,需要先卸载.
否则会导致驱动使用异常的问题,两者不能共存.
2.
使用IEF提供的驱动安装脚本进行安装的驱动和直接在操作系统上安装的驱动在本质上没有区别.
nvidia-gpu-installer.
sh脚本会下载并安装相应版本的GPU驱动并打包制作成镜像,最终会运行一个GPU的插件容器,通过这种方式将GPU驱动共享给其他的业务容器.
如果直接在主机操作系统安装的话,容器无法获取主机上安装GPU驱动.
2.
9应用GPU资源调度方式1.
IEF支持多应用共享的方式使用GPU显卡.
2.
IEF支持单个应用使用多个GPU显卡.
3.
GPU资源调度基于GPU显存容量,调度采用GPU显存预分配方式而非实时GPU显存资源.
4.
当应用需要使用的GPU显存资源小于单个GPU卡显存时,支持以共享方式进行资源调度,对现有GPU卡剩余资源从小到大进行排序,从中找到第一个满足资源需求的显卡进行部署.
例如有三个显卡a、b、c,每个显卡显存资源是8G,剩余显存资源是2G、4G、6G,有应用A需要显存3G,则会调度到b显卡上.
5.
当应用需要使用的GPU显存资源大于单个GPU卡显存时,支持以多显卡方式进行资源调度,调度时会占用完整显卡资源(剩余部分不能分给其他容器).
例如有三个显卡a、b、c,每个显卡显存资源是8G,剩余显存资源是8G、8G、6G,有应用B需要显存14G,则会调度到a和b显卡上,并且其他应用无法调度到a和b显卡上.
2.
10如何控制容器引擎占用磁盘空间大小您可以控制容器引擎占用磁盘空间大小.
前提条件使用CentOS操作系统.
配置方法执行如下命令修改容器引擎的daemon.
json文件.
vi/etc/docker/daemon.
json智能边缘平台常见问题2边缘应用文档版本01(2021-02-20)版权所有华为技术有限公司32将storage-driver设置为devicemapper,并设置storage-opts下的dm.
basesize取值,dm.
basesize即为磁盘空间大小.
如下示例,将容器引擎的磁盘空间限制为10G.
{"storage-driver":"devicemapper","storage-opts":["dm.
basesize=10G"]}智能边缘平台常见问题2边缘应用文档版本01(2021-02-20)版权所有华为技术有限公司333边云消息3.
1什么是路由管理路由管理是根据用户配置的消息路由从指定的源端点转发到目的端点,目前支持的场景包括:1.
边缘文件服务:SystemREST到Servicebus,通过调用云端的RESTgateway接口,获取边缘节点上的文件服务.
2.
边缘消息下发服务:SystemREST到SystemEventBus,通过调用云端的RESTgateway接口,向边缘节点中的mqtt发送消息.
3.
设备数据转发服务:SystemEventBus到DIS/APIG服务,将绑定到节点的边缘设备数据转发到DIS服务或指定APIG网关地址.
3.
2路由管理中的端点是什么逻辑上的数据连接点(来源与目的点).
3.
3消息路由是什么将指定数据从源端点转发到目的端点的转发路径.
3.
4创建消息路由失败是什么原因端点资源中需要按照指定格式创建.
如果带有mqtttopic需要满足不带有特殊字符,不重复不交叠.
如果带有DIS服务,需要保证DIS通道处于运行状态.
如果带有APIG,需要保证APIG网关地址为正确格式.
3.
5消息路由转发失败是什么原因转发失败数增加说明该条消息转发到指定的目的端点失败,可以单击转发失败数查看失败详情(错误码),根据该错误码判断目的端点后端服务是否有问题不可达.
智能边缘平台常见问题3边云消息文档版本01(2021-02-20)版权所有华为技术有限公司343.
6消息路由的启用与停用消息路由停用后,符合消息路由的消息不会再被转发到目的端点,需要重新启用后才可以继续使用消息路由进行转发.
智能边缘平台常见问题3边云消息文档版本01(2021-02-20)版权所有华为技术有限公司354网络管理4.
1边缘节点一般通过什么网络连接到IEF通常可以选择Internet,VPN或者专线接入,您可以根据业务场景选择不同的网络连接.
如果您对数据安全、数据传输性能有要求,您可以选择专线或者VPN接入.
4.
2使用proxy网络代理时如何处理边缘节点如果使用了proxy网络代理,那么需要设置边缘节点和容器应用.
说明当前仅支持HTTP代理.
边缘节点设置如果边缘节点使用proxy网络代理,您需要编辑"/opt/IEF/Cert/user_config",增加配置HTTP_PROXY和HTTPS_PROXY参数.
执行如下命令,在"/opt/IEF/Cert/user_config"中增加如下两个配置项,其中"http://192.
168.
0.
70:8888"请替换为实际的网络代理地址.
vi/opt/IEF/Cert/user_config配置文件修改后,再执行安装命令.
网络代理如果需要用户名密码认证,可以在代理地址前增加用户名密码,上面"http://192.
168.
0.
70:8888"则改为下面格式,其中username和paasword即为用户名和密码.
http://username:paasword@192.
168.
0.
70:8888智能边缘平台常见问题4网络管理文档版本01(2021-02-20)版权所有华为技术有限公司36容器应用设置如果边缘节点使用proxy网络代理,容器应用如果需要访问外部网络也需要设置proxy.
您可以在创建容器应用时配置如下环境变量.
http_proxy和https_proxy为所用的网络代理地址,请替换为实际的网络代理地址.
对于某些需要忽略代理的地址/ip需配置no_proxy变量,即对这个地址进行例外设置,不使用网络代理.
智能边缘平台常见问题4网络管理文档版本01(2021-02-20)版权所有华为技术有限公司375基本概念5.
1什么是智能边缘平台智能边缘平台(IntelligentEdgeFabric)通过纳管用户的边缘节点,提供将云上应用延伸到边缘的能力,联动边缘和云端的数据,满足客户对边缘计算资源的远程管控、数据处理、分析决策、智能化的诉求,同时,在云端提供统一的设备/应用监控、日志采集等运维能力,为企业提供完整的边缘和云协同的一体化服务的边缘计算解决方案.
5.
2使用智能边缘平台能带来哪些收益智能边缘提供系列化的端云协同服务,包括远程端侧设备管理、流处理等一系列服务,为客户在时延敏感型业务、带宽敏感型业务、安全性和合规性要求高的业务等场景下遇到的问题,提供完善解决方案.
时延敏感型业务针对时延敏感型业务,智能边缘提供就近的数据处理、应用智能等服务,能够快速响应业务实时性要求.
带宽敏感型业务针对带宽敏感型业务,如业务端侧数据量大的业务,智能边缘平台可以提供数据预处理功能,避免大量数据传递到云端,降低带宽等IT设施投资.
安全性和合规性要求高的业务安全性及合规性要求高的业务,要求端侧数据不能传递到云端,智能边缘平台提供本地数据处理功能、分析等功能,满足客户在安全与合规性等方面的需求.
5.
3智能边缘平台的主要使用场景智能边缘主要应用于时延敏感型业务、带宽敏感型业务、安全性和合规性要求高的业务等场景,包括但不局限于以下典型应用场景:工业视觉场景工业制造预测性维护场景智能边缘平台常见问题5基本概念文档版本01(2021-02-20)版权所有华为技术有限公司385.
4什么是边缘函数边缘函数是智能边缘平台提供的一种在边缘节点的无服务器(Serverless)计算服务,能够将FunctionGraph中的函数下发至边缘节点中运行.
5.
5什么是函数依赖库与函数是什么关系函数依赖库相当于函数运行时的依赖,例如第三方库,AI的训练模型,可以通过函数的配置,把依赖库挂载在函数的执行目录下,函数运行时就可以加载到第三方依赖.
5.
6可以用什么语言编写函数边缘函数当前支持python2.
7、python3.
6的函数部署到边缘节点.
后续将继续扩展支持能力,最终使得所有在云上支持的函数均可以调度至边缘节点.
5.
7函数的远程控制和长时间运行分别代表什么含义边缘函数由于在用户所拥有的设备中运行,而具有特殊运行环境与特殊运行场景.
在智能边缘平台创建函数的时候可以选择"远程控制"和"长时间运行".
长时间运行的函数可以为边缘设备提供长时间持续性的工作.
远程控制的函数给用户提供了更大的灵活性,基于事件机制,可以控制函数工作的生命周期.
智能边缘平台常见问题5基本概念文档版本01(2021-02-20)版权所有华为技术有限公司396其他6.
1区域和可用区什么是区域、可用区我们用区域和可用区来描述数据中心的位置,您可以在特定的区域、可用区创建资源.
区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务.
Region分为通用Region和专属Region,通用Region指面向公共租户提供通用云服务的Region;专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region.
可用区(AZ,AvailabilityZone):一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群.
一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求.
图6-1阐明了区域和可用区之间的关系.
图6-1区域和可用区目前,华为云已在全球多个地域开放云服务,您可以根据需求选择适合自己的区域和可用区.
更多信息请参见华为云全球站点.
智能边缘平台常见问题6其他文档版本01(2021-02-20)版权所有华为技术有限公司40如何选择区域选择区域时,您需要考虑以下几个因素:地理位置一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度.
不过,在基础设施、BGP网络品质、资源的操作与配置等方面,中国大陆各个区域间区别不大,如果您或者您的目标用户在中国大陆,可以不用考虑不同区域造成的网络时延问题.
–在除中国大陆以外的亚太地区有业务的用户,可以选择"亚太-香港"、"亚太-曼谷"或"亚太-新加坡"区域.
–在非洲地区有业务的用户,可以选择"南非-约翰内斯堡"区域.
–在欧洲地区有业务的用户,可以选择"欧洲-巴黎"区域.
–在拉丁美洲地区有业务的用户,可以选择"拉美-圣地亚哥"区域.
说明"拉美-圣地亚哥"区域位于智利.
资源的价格不同区域的资源价格可能有差异,请参见华为云服务价格详情.
如何选择可用区是否将资源放在同一可用区内,主要取决于您对容灾能力和网络时延的要求.
如果您的应用需要较高的容灾能力,建议您将资源部署在同一区域的不同可用区内.
如果您的应用要求实例之间的网络延时较低,则建议您将资源创建在同一可用区内.
区域和终端节点当您通过API使用资源时,您必须指定其区域终端节点.
有关华为云的区域和终端节点的更多信息,请参阅地区和终端节点.
6.
2智能边缘平台支持边缘节点的规格智能边缘平台支持边缘节点规格如下:智能边缘平台常见问题6其他文档版本01(2021-02-20)版权所有华为技术有限公司41表6-1边缘节点要求项目规格OSx86_64架构Ubuntu16.
04LTS(XenialXerus)、Ubuntu18.
04LTS(BionicBeaver)、CentOS7.
x和RHEL7.
x、银河麒麟4.
0.
2、中兴新支点v5.
5、中标麒麟v7.
0armv7i(arm32)架构RaspbianGNU/Linux9(stretch)aarch64(arm64)架构Ubuntu18.
04.
2LTS(BionicBeaver)内存边缘软件开销约128MB,为保证业务的正常运行,建议边缘节点的内存大于256MB.
CPU>=1核硬盘>=1GBGPU(可选)同一个边缘节点上的GPU型号必须相同.
说明当前支持NvidiaTesla系列P4、P40、T4等型号GPU.
含有GPU硬件的设备,作为边缘节点的时候可以不使用GPU.
如果边缘节点使用GPU,您需要在纳管前安装GPU驱动.
NPU(可选)华为昇腾AI加速处理器.
说明当前仅支持集成了华为昇腾310芯片的设备,如Atlas300推理卡、Atlas500智能小站、Atlas800推理服务器.
如果边缘节点使用NPU,请确保设备已安装驱动.
如果没有安装驱动,请联系厂商获取支持.
容器引擎(使用容器应用的场景必选)Docker版本必须高于17.
06,推荐使用18.
06.
3版本.
(请勿使用18.
09.
0版本Docker,该版本存在严重bug,详见https://github.
com/docker/for-linux/issues/543;如果已使用此版本,请尽快升级.
Atlas500小站预置的Docker18.
09.
0.
60软件版本已经修改该问题.
)须知Docker安装完成后,请将Docker进程配置为开机启动,避免系统重启后Docker进程未启动引起的系统异常.
互联网协议必须支持IPv6协议.
glibc版本必须高于2.
17.
智能边缘平台常见问题6其他文档版本01(2021-02-20)版权所有华为技术有限公司42项目规格端口使用边缘节点需要使用如下端口,请确保这些端口能够正常使用.
8102:边缘节点日志上报至应用运维管理(ApplicationOperationsManagement,AOM)服务8149:边缘节点监控上报至AOM8065:边缘节点告警上报至AOM443:边缘节点连接IEF8883:内置MQTTBroker使用的端口1883:外置MQTTBroker使用的端口20004:边缘节点上报消息到DIS时间同步边缘节点时间需要与UTC标准时间保持一致,否则会导致边缘节点的监控数据、日志上传出现偏差.
您可以选择合适的NTP服务器进行时间同步,从而保持时间一致.
详细配置方法请参见如何同步NTP服务器.
6.
3什么场景下适用函数什么场景下适用容器1.
函数比容器拥有更加轻量级的运行时引擎,如果您的边缘节点资源受限(内存小于128MB),建议采用函数的方式.
2.
如果您的边缘应用业务逻辑是基于事件驱动,建议您使用函数的方式,函数可以通过事件触发的机制近乎实时的快速响应.
3.
容器具有更强大生态,能帮助您的容器应用无缝切换到其他的运行环境中,具有更好的可移植性;另外容器具有更好的资源隔离性.
6.
4设备属性和设备孪生有什么区别设备属性代表了设备的静态信息,如设备名称,设备IP地址等.
设备孪生表示了设备的动态控制信息,如果温度传感器的温度,湿度传感器的湿度等.
您可以通过更改设备孪生中的期望值,从而达到控制边缘设备的目的.
边缘设备可以上报传感器的实际值,从而反应当前设备的真实状态.
6.
5IEF需要使用什么编程语言开发IEF支持将容器应用和函数部署到边缘节点,并管理容器应用和函数.
对于容器应用,可以使用任何语言开发应用.
对于函数应用,当前支持python2.
7、python3.
6的函数部署到边缘节点.
6.
6IEF需要自己提供节点吗需要,且边缘节点需要满足一定的要求,具体请参见使用要求.
智能边缘平台常见问题6其他文档版本01(2021-02-20)版权所有华为技术有限公司436.
7IEF欠费后,之前下发的应用还能用吗帐号欠费后,应用将会被冻结,帐号被冻结后将进入保留期(不同帐号保留期不同,具体请在费用中心查询),保留期内可在控制台查看到应用但无法执行任何操作.
保留期结束后,应用将会被强制删除.
例如:1.
假如帐号于2019年12月10号开始欠费,将进入保留期(例如15天),因此从2019年12月10号开始,停止计费,在保留期内可看到应用但无法操作.
2.
2019年12月25号保留期结束,如果帐号仍然欠费,会强制删除帐号下所有应用.
6.
8IEF与IoT边缘有什么区别IEF为用户提供完整的边缘和云协同的一体化服务,拥有强大的应用管理、边云协同能力,能够统一从云端下发应用到边缘,帮助用户在云端统一对边缘应用进行管理、监控和运维.
IoT边缘主要是边缘的设备管理,拥有强大的多设备多协议接入能力,且提供边缘数据清洗功能,在边缘清洗数据.
6.
9如何为IAM用户/子帐号配置IEF使用权限IEF暂时不支持使用统一身份认证服务(IdentityandAccessManagement,简称IAM)进行精细的权限管理,建议您使用帐号直接登录,如果需要使用IAM用户,需要授予IAM用户TenantAdministrator权限.
缺少权限的IAM用户可能会导致注册边缘节点失败、无法创建应用.
步骤1登录IAM控制台,选择用户组,在用户组右侧单击"权限配置".
图6-2权限配置步骤2单击"配置权限".
智能边缘平台常见问题6其他文档版本01(2021-02-20)版权所有华为技术有限公司44图6-3配置权限步骤3选择区域级项目,搜索TenantAdministrator并勾选,然后单击"确定".
图6-4选择权限----结束6.
10自动创建委托失败如何解决自动创建委托失败的原因是IAM用户权限不够,您需要授予IAM用户TenantAdministrator权限,具体请参见创建用户并授权使用IEF.
智能边缘平台常见问题6其他文档版本01(2021-02-20)版权所有华为技术有限公司45
轻云互联成立于2018年的国人商家,广州轻云互联网络科技有限公司旗下品牌,主要从事VPS、虚拟主机等云计算产品业务,适合建站、新手上车的值得选择,香港三网直连(电信CN2GIA联通移动CN2直连);美国圣何塞(回程三网CN2GIA)线路,所有产品均采用KVM虚拟技术架构,高效售后保障,稳定多年,高性能可用,网络优质,为您的业务保驾护航。活动规则:用户购买任意全区域云服务器月付以上享受免费更换IP服...
收到10gbiz发来的7月份优惠方案,中国香港、美国洛杉矶机房VPS主机4折优惠码,优惠后洛杉矶VPS月付2.36美元起,香港VPS月付2.75美元起。这是一家2020年成立的主机商,提供的产品包括独立服务器租用和VPS主机等,数据中心在美国洛杉矶、圣何塞和中国香港。商家VPS主机基于KVM架构,支持使用PayPal或者支付宝付款。洛杉矶VPS架构CPU内存硬盘带宽系统价格单核512MB10GB1...
傲游主机商我们可能很多人并不陌生,实际上这个商家早年也就是个人主机商,传说是有几个个人投资创办的,不过能坚持到现在也算不错,毕竟有早年的用户积累正常情况上还是能延续的。如果是新服务商这几年确实不是特别容易,问到几个老牌的个人服务商很多都是早年的用户积累客户群。傲游主机目前有提供XEN和KVM架构的云服务器,不少还是亚洲CN2优化节点,目前数据中心包括中国香港、韩国、德国、荷兰和美国等多个地区的CN...
浩方登陆服务器失败为你推荐
重庆网络公司一九互联重庆本地的网约车平台有哪些?如何识别比较正规的网约车平台?asp.net空间哪里可以申请asp空间的?asp.net网页制作使用ASP.net技术创建一个网页,如何做?温州商标注册温州代理注册个商标是怎么收费的?佛山海虹广东海虹药通电子商务有限公司怎么样?什么是通配符什么是介母servicetemporarilyunavailableService Temporarily Unavailable的503错误是怎么回事网店系统哪个公司开发商城系统比较好?zencartzencart是什么?zencart有什么作用?顽固木马专杀手机管家和顽固木马专杀哪个好用
查域名 国外免费vps kdata 163网 payoneer 12306抢票助手 合肥鹏博士 柚子舍官网 广州服务器 百度云1t vip域名 电信托管 我的世界服务器ip 国内域名 国外的代理服务器 永久免费空间 国内空间 免备案cdn加速 789电视剧网 贵州电信 更多