歡迎光臨管理者范文網(wǎng)
當(dāng)前位置:管理者范文網(wǎng) > 安全管理 > 崗位職責(zé) > 工程崗位職責(zé)

sre工程師崗位職責(zé)14篇

更新時間:2024-11-20 查看人數(shù):55

sre工程師崗位職責(zé)

第1篇 sre高級工程師-效率工程職位描述與崗位職責(zé)任職要求

職位描述:

工作職責(zé):

sre 團隊參與并改善服務(wù)的整個生命周期 - 從啟動、設(shè)計、部署、運維和優(yōu)化,職責(zé)包括但不限于:

1、用性數(shù)據(jù)采集、統(tǒng)計、監(jiān)控、報警系統(tǒng)開發(fā)與維護

2、積極參與業(yè)務(wù)方案討論與設(shè)計,并推進優(yōu)化服務(wù)的響應(yīng)延遲、性能問題,提升服務(wù)可用性

3、服務(wù)的變更管理、容量規(guī)劃及對應(yīng)工具平臺建設(shè)

4、實行事故應(yīng)急機制,參與及推進事故本質(zhì)原因的調(diào)查及改進

任職要求:

1、良好的設(shè)計和編碼品味,熱愛編程

2、深刻理解計算機原理,有良好的數(shù)據(jù)結(jié)構(gòu)和算法基礎(chǔ)

3、對穩(wěn)定性和性能有超乎尋常的關(guān)注

4、掌握 web 后端開發(fā)技術(shù): 協(xié)議、架構(gòu)、存儲、緩存、安全等

5、較強的主人翁意識、自我驅(qū)動,發(fā)現(xiàn)問題、動手解決問題的能力

6、具備良好的溝通、團隊協(xié)作能力

第2篇 sre運維研發(fā)工程師職位描述與崗位職責(zé)任職要求

職位描述:

工作職責(zé):

1、負(fù)責(zé)字節(jié)跳動云平臺的系統(tǒng)高可用架構(gòu)和規(guī)劃;

2、設(shè)計并實現(xiàn)能夠保障線上大規(guī)模集群的迭代、自動化運維平臺;

3、負(fù)責(zé)量化云服務(wù)的服務(wù)質(zhì)量,提升服務(wù)sla標(biāo)準(zhǔn);

4、支持平臺用戶線上需求和解決用戶遇到的各種問題;

5、升整體云平臺的運維管理效率。

任職要求:

1、有大型系統(tǒng)的運維管理經(jīng)驗,2年以上相關(guān)工作經(jīng)驗;

2、精通linu_系統(tǒng)、shell/python/c等編程語言、網(wǎng)絡(luò)tcp/ip協(xié)議、數(shù)據(jù)庫等,動手能力強;

3、較強的分析和解決問題的能力,強烈責(zé)任感、 縝密的邏輯思維能力;

4、有較強的系統(tǒng)問題分析經(jīng)驗和能力,能夠解決復(fù)雜的系統(tǒng)問題;

5、有大型云計算公司從業(yè)經(jīng)驗,對openstack系統(tǒng)開發(fā)、測試、運維、應(yīng)用工作經(jīng)驗者,熟悉源碼優(yōu)先;

6、有監(jiān)控系統(tǒng)構(gòu)建研發(fā)經(jīng)驗優(yōu)先。

第3篇 aml機器學(xué)習(xí)平臺sre工程師職位描述與崗位職責(zé)任職要求

職位描述:

工作職責(zé):

1、aml: applied machine learning

2、設(shè)計和搭建高可靠的機器學(xué)習(xí)系統(tǒng)

3、負(fù)責(zé)機器學(xué)習(xí)服務(wù)各環(huán)節(jié) (樣本生成,樣本管理,模型訓(xùn)練,模型服務(wù),實時更新)的穩(wěn)定運轉(zhuǎn)

4、硬件資源的管理與規(guī)劃

任職要求:

1、扎實的編程基礎(chǔ),熟練掌握 c/c++, python,uni_ shell

2、有大型分布式軟件 (如spark, yarn和tensorflow等) 的資源管理和任務(wù)調(diào)度經(jīng)驗

3、熟悉操作系統(tǒng)和計算機體系結(jié)構(gòu)

加分項:

1、熟悉至少一種主流深度學(xué)習(xí)編程框架(tensorflow/caffe/m_net),熟悉其底層架構(gòu)和實現(xiàn)機制

2、有過開源社區(qū)經(jīng)歷

第4篇 sre基礎(chǔ)設(shè)施研發(fā)工程師職位描述與崗位職責(zé)任職要求

職位描述:

工作職責(zé):

為頭條各服務(wù)提供堅實的運行時基礎(chǔ)設(shè)施支撐,職責(zé)包括但不限于:

1、根據(jù)業(yè)務(wù)特點,選型、設(shè)計和開發(fā)高容錯能力的調(diào)度控制系統(tǒng),提高自動化運維水平;

2、優(yōu)化改進超大規(guī)模集群上服務(wù)和批處理任務(wù)的調(diào)度能力,提高資源利用率,提高在復(fù)雜網(wǎng)絡(luò)環(huán)境下服務(wù)的可用性;

3、維護和開發(fā)服務(wù)發(fā)現(xiàn)系統(tǒng),保證極高的可用性水平;

4、保證metric系統(tǒng)的可用性,在高吞吐能力下保證較低的查詢延遲;

5、研發(fā)和改進在多類型負(fù)載混布環(huán)境下的資源隔離技術(shù)(cpu,內(nèi)存,磁盤io,網(wǎng)絡(luò)io等)。

任職要求:

1、熟悉以下至少一門語言:c/c++,python, java/scala, go;

2、熟悉linu_系統(tǒng)常用debug, profiling工具, 具有定位疑難bug的能力;

3、能夠設(shè)計、實現(xiàn)高可靠、高性能的分布式系統(tǒng);

4、較強的自我驅(qū)動,發(fā)現(xiàn)問題、動手解決問題能力;

5、對技術(shù)有強烈熱情和好奇心,能快速學(xué)習(xí)新程序設(shè)計語言和工具;

6、具有以下一項或多項經(jīng)驗者優(yōu)先:mesos/yarn/kubernetes的二次開發(fā)經(jīng)驗;熟悉linu_ 內(nèi)核/sdn網(wǎng)絡(luò);l_c/docker/rkt等容器引擎的研發(fā)經(jīng)驗;consul/etcd/zookeeper的運維和開發(fā)經(jīng)驗。

第5篇 sre工程師-抖音/火山職位描述與崗位職責(zé)任職要求

職位描述:

工作職責(zé):

1、負(fù)責(zé)抖音、火山等海內(nèi)外億級產(chǎn)品的大規(guī)模集群的sre和運維優(yōu)化工作

2、負(fù)責(zé)核心服務(wù)的持續(xù)集成和交付,高效和自動化的運維優(yōu)化,提升服務(wù)的穩(wěn)定性和研發(fā)效率

3、負(fù)責(zé)大規(guī)模集群的云平臺化、資源優(yōu)化、sla保障。

任職要求:

1、大規(guī)模系統(tǒng)的sre或運維經(jīng)驗,熟悉linu_、網(wǎng)絡(luò)等系統(tǒng)運維的技能;

2、對大規(guī)模分布式系統(tǒng)的設(shè)計,分析,故障排查有強烈興趣

3、開發(fā)語言python/shell;

4、有以下經(jīng)驗者優(yōu)先:云平臺相關(guān)經(jīng)驗(阿里云、aws等)

第6篇 高級sre工程師崗位職責(zé)任職要求

高級sre工程師崗位職責(zé)

工作職責(zé):

1、建設(shè)網(wǎng)絡(luò)評估體系;

2、全球化產(chǎn)品的網(wǎng)絡(luò)調(diào)優(yōu)、故障排除等;

任職要求:

1、有海量用戶的產(chǎn)品開發(fā)運維經(jīng)驗,對網(wǎng)絡(luò)劫持、故障有能力迅速定位并解決;

2、熟悉tcp/ip、http、http協(xié)議,了解http2、quic等協(xié)議;

3、熟悉linu_環(huán)境,熟悉socket編程,熟悉c++/python/golang之一;

4、熟悉網(wǎng)絡(luò)交換/路由原理;

5、對用戶體驗有極致的追求,有用戶至上的強烈熱情;

6、有過海外2c產(chǎn)品運維和開發(fā)經(jīng)驗者優(yōu)先;

7、可以接受偶爾短期國外出差。

第7篇 高級網(wǎng)絡(luò)sre工程師職位描述與崗位職責(zé)任職要求

職位描述:

工作職責(zé):

1、建設(shè)網(wǎng)絡(luò)評估體系;

2、全球化產(chǎn)品的網(wǎng)絡(luò)調(diào)優(yōu)、故障排除等;

任職要求:

1、有海量用戶的產(chǎn)品開發(fā)運維經(jīng)驗,對網(wǎng)絡(luò)劫持、故障有能力迅速定位并解決;

2、熟悉tcp/ip、http、http協(xié)議,了解http2、quic等協(xié)議;

3、熟悉linu_環(huán)境,熟悉socket編程,熟悉c++/python/golang之一;

4、熟悉網(wǎng)絡(luò)交換/路由原理;

5、對用戶體驗有極致的追求,有用戶至上的強烈熱情;

6、有過海外2c產(chǎn)品運維和開發(fā)經(jīng)驗者優(yōu)先;

7、可以接受偶爾短期國外出差。

第8篇 視頻架構(gòu)sre(高級)工程師職位描述與崗位職責(zé)任職要求

職位描述:

工作職責(zé):

1、參與并改進視頻云基礎(chǔ)服務(wù)的整個生命周期,包括設(shè)計/架構(gòu)/部署/運維以及持續(xù)優(yōu)化

2、通過設(shè)計及監(jiān)控可用性,延時等服務(wù)整體健康性指標(biāo),來運維視頻云平臺服務(wù)

3、通過自動化/系統(tǒng)化的方式,以可持續(xù)維護的目標(biāo)來擴容服務(wù),并且主動提出和實施改進服務(wù)穩(wěn)定性及運維靈活性的方案, 提升整體視頻云平臺的運維管理效率

4、負(fù)責(zé)量化視頻云服務(wù)的服務(wù)質(zhì)量,提升服務(wù)sla標(biāo)準(zhǔn)

任職要求:

1、有大型系統(tǒng)的運維管理經(jīng)驗,2年以上相關(guān)工作經(jīng)驗;

2、精通linu_系統(tǒng)、shell/python編程語言、網(wǎng)絡(luò)tcp/ip協(xié)議、數(shù)據(jù)庫等,動手能力強

3、對大規(guī)模分布式系統(tǒng)的設(shè)計,分析,故障排查有強烈興趣

4、較強的分析和解決問題的能力,強烈責(zé)任感、 縝密的邏輯思維能力,并有很強的溝通以及主動推進問題直至解決的能力

5、有大型云計算公司從業(yè)經(jīng)驗,對于阿里云、aws系統(tǒng)開發(fā)、測試、運維、應(yīng)用工作經(jīng)驗者優(yōu)先

第9篇 推薦架構(gòu)sre工程師-抖音/火山職位描述與崗位職責(zé)任職要求

職位描述:

工作職責(zé):

1、負(fù)責(zé)抖音、火山等海內(nèi)外億級產(chǎn)品的大規(guī)模集群的sre和運維優(yōu)化工作

2、負(fù)責(zé)核心服務(wù)的持續(xù)集成和交付,高效和自動化的運維優(yōu)化,提升服務(wù)的穩(wěn)定性和研發(fā)效率

3、負(fù)責(zé)大規(guī)模集群的云平臺化、資源優(yōu)化、sla保障。

任職要求:

1、大規(guī)模系統(tǒng)的sre或運維經(jīng)驗,熟悉linu_、網(wǎng)絡(luò)等系統(tǒng)運維的技能;

2、對大規(guī)模分布式系統(tǒng)的設(shè)計,分析,故障排查有強烈興趣

3、開發(fā)語言python/shell;

4、有以下經(jīng)驗者優(yōu)先:云平臺相關(guān)經(jīng)驗(阿里云、aws等)。

第10篇 hadoop sre工程師職位描述與崗位職責(zé)任職要求

職位描述:

工作職責(zé):

1、參與打造業(yè)界領(lǐng)先的存儲、計算、消息隊列等分布式系統(tǒng)

2、為海量數(shù)據(jù)及其上的大規(guī)模數(shù)據(jù)挖掘、數(shù)據(jù)分析、機器學(xué)習(xí)業(yè)務(wù)系統(tǒng)提供可靠、高效的支持

3、深入了解業(yè)務(wù)需求,利用存儲技術(shù)支持關(guān)鍵業(yè)務(wù)場景

任職要求:

1、掌握分布式系統(tǒng)原理,對存儲、計算、消息隊列的一項或多項有深入的理解和認(rèn)識

2、樂于挑戰(zhàn)沒有明顯答案的問題,能快速理解業(yè)務(wù)場景,從具體問題中抽象出通用的解決方案

3、有較好的溝通能力;有良好的團隊合作精神

第11篇 直播cdn/實時通信sre工程師職位描述與崗位職責(zé)任職要求

職位描述:

工作職責(zé):

1、負(fù)責(zé)直播cdn/實時通信的系統(tǒng)高可用架構(gòu)和規(guī)劃,包括但不限于全鏈路壓測、故障診斷、故障容災(zāi)、智能調(diào)度、彈性擴容與防攻擊

2、設(shè)計并實現(xiàn)能夠保障線上大規(guī)模集群的迭代、自動化運維平臺

3、全球化流媒體傳輸網(wǎng)絡(luò)建設(shè)與調(diào)優(yōu)

4、設(shè)計優(yōu)化的qos數(shù)據(jù)上報機制,大數(shù)據(jù)pipeline,監(jiān)控,分析和報表系統(tǒng),不間斷監(jiān)測用戶體驗

任職要求:

1、有大型系統(tǒng)的運維管理經(jīng)驗,對立體監(jiān)控、自動部署、容量管理、自動容災(zāi)有較深入的理解和實踐經(jīng)驗

2、熟悉linu_操作系統(tǒng)、tcp/ip等常用協(xié)議,熟悉cdn & dns 基本原理,了解ngin_/lvs/puppet/ansible/zabbi_/falcon等開源軟件(至少2種)

3、熟悉全鏈路壓測、降級、流控、熔斷等穩(wěn)定性保障手段

4、有日志處理及分析相關(guān)經(jīng)驗,熟悉相關(guān)的組件者優(yōu)先,如:kafka,elk,flink,storm,flume等

5、有監(jiān)控系統(tǒng)構(gòu)建研發(fā)經(jīng)驗優(yōu)先

第12篇 高級sre工程師崗位職責(zé)

高級網(wǎng)絡(luò)sre工程師 7.職位描述:

1、建設(shè)網(wǎng)絡(luò)評估體系;

2、全球化產(chǎn)品的網(wǎng)絡(luò)調(diào)優(yōu)、故障排除等; 職位要求:

1、有海量用戶的產(chǎn)品開發(fā)運維經(jīng)驗,對網(wǎng)絡(luò)劫持、故障有能力迅速定位并解決;

2、熟悉 tcp/ip、http、https 協(xié)議,了解 http2、quic 等協(xié)議;

3、熟悉 linu_ 環(huán)境,熟悉 socket 編程,熟悉 c++/python/go 之一;

4、熟悉網(wǎng)絡(luò)交換/路由原理;

5、對用戶體驗有的追求,有用戶至上的強烈熱情;

6、有過海外 2c 產(chǎn)品運維和開發(fā)經(jīng)驗者優(yōu)先;

7、可以接受偶爾短期國外出差。 7.職位描述:

1、建設(shè)網(wǎng)絡(luò)評估體系;

2、全球化產(chǎn)品的網(wǎng)絡(luò)調(diào)優(yōu)、故障排除等; 職位要求:

1、有海量用戶的產(chǎn)品開發(fā)運維經(jīng)驗,對網(wǎng)絡(luò)劫持、故障有能力迅速定位并解決;

2、熟悉 tcp/ip、http、https 協(xié)議,了解 http2、quic 等協(xié)議;

3、熟悉 linu_ 環(huán)境,熟悉 socket 編程,熟悉 c++/python/go 之一;

4、熟悉網(wǎng)絡(luò)交換/路由原理;

5、對用戶體驗有的追求,有用戶至上的強烈熱情;

6、有過海外 2c 產(chǎn)品運維和開發(fā)經(jīng)驗者優(yōu)先;

7、可以接受偶爾短期國外出差。

第13篇 sre高級工程師職位描述與崗位職責(zé)任職要求

職位描述:

工作職責(zé):

1、推進優(yōu)化基礎(chǔ)服務(wù)的響應(yīng)延遲、性能問題,提升服務(wù)穩(wěn)定性;

2、負(fù)責(zé)各種基礎(chǔ)系統(tǒng)搭建和維護(dns、ldap等);

3、開發(fā)自動化運維平臺,提高運維、開發(fā)協(xié)作效率,規(guī)范操作流程;

4、優(yōu)化各種系統(tǒng),減少重復(fù)性工作;

5、負(fù)責(zé)公司基礎(chǔ)監(jiān)控、報警系統(tǒng)開發(fā)與維護。

任職要求:

1 、大學(xué)本科(統(tǒng)招)及以上學(xué)歷,計算機相關(guān)專業(yè);

2 、三年以上運維開發(fā)項目經(jīng)驗;

3 、掌握常用開發(fā)語言 shell/python/golang,熟悉業(yè)界主流技術(shù),如open-falcon、grafana等;

4、 熟悉 linu_ 操作系統(tǒng),熟悉各種網(wǎng)絡(luò)協(xié)議;

5 、有開源項目貢獻者或開源項目領(lǐng)導(dǎo)者優(yōu)先;

6 、有較強的學(xué)習(xí)能力,能夠熟練閱讀涉及產(chǎn)品和技術(shù)的英文文檔;

7 、能夠承受較高的工作壓力;有強烈的工作責(zé)任心;有較好的溝通能力;有良好的團隊合作精神;

8 、能夠獨立完成工作,具有較強的綜合分析問題及解決問題的能力;

9 、有良好的工作文檔習(xí)慣,及時按要求撰寫更新工作流程及技術(shù)文檔。

第14篇 sre 運維工程師職位描述與崗位職責(zé)任職要求

職位描述:

工作職責(zé):

1、負(fù)責(zé)企業(yè)套件生產(chǎn)系統(tǒng)的監(jiān)控,審查,故障響應(yīng)、排查、解決與后續(xù)優(yōu)化推進工作;

2、持續(xù)監(jiān)控和審查系統(tǒng)架構(gòu)合理性、流程邏輯合理性,系統(tǒng)性能、穩(wěn)定性等技術(shù)領(lǐng)域和指標(biāo),并有責(zé)任和權(quán)利驅(qū)動業(yè)務(wù)團隊解決問題;

3、負(fù)責(zé)第一時間響應(yīng)生產(chǎn)故障,作為總體調(diào)度角色,組織相關(guān)研發(fā)、運維、產(chǎn)品等各方聯(lián)合排查和解決問題,對故障響應(yīng)時間、故障解決時間負(fù)責(zé);

4、組織case study,跟進后續(xù)優(yōu)化。

任職要求:

1、計算機相關(guān)專業(yè),本科學(xué)歷,3年以上互聯(lián)網(wǎng)研發(fā),或系統(tǒng)運維,或sre相關(guān)經(jīng)驗;

2、熟悉互聯(lián)網(wǎng)技術(shù)架構(gòu),對網(wǎng)絡(luò)通訊協(xié)議、應(yīng)用服務(wù)器、負(fù)載均衡、微服務(wù)架構(gòu)有較深入的理解;

3、熟悉互聯(lián)網(wǎng)通用的組件,對消息中間件、分布式緩存、數(shù)據(jù)庫有較深入的理解;

4、有較好的業(yè)務(wù)架構(gòu)能力,能很好的理解高可用、高并發(fā)架構(gòu)搭建方法;

5、有豐富的系統(tǒng)運維經(jīng)驗,對常見的系統(tǒng)隱患、系統(tǒng)故障有系統(tǒng)性總結(jié)和實際處理經(jīng)驗;

6、性格開朗外向,有很好的溝通技巧,有很強的責(zé)任心,具備優(yōu)秀的推動力,做事追求極致。

sre工程師崗位職責(zé)14篇

職位描述:工作職責(zé):1、aml:aliedmachinelearning2、設(shè)計和搭建高可靠的機器學(xué)習(xí)系統(tǒng)3、負(fù)責(zé)機器學(xué)習(xí)服務(wù)各環(huán)節(jié)(樣本生成,樣本管理,模型訓(xùn)練,模型服務(wù),實時更新)的穩(wěn)定運轉(zhuǎn)4、硬件資源的管理與規(guī)劃任職要求:1、扎實的編程基礎(chǔ),熟練掌握c…
推薦度:
點擊下載文檔文檔為doc格式

相關(guān)sre信息

  • sre工程師崗位職責(zé)14篇
  • sre工程師崗位職責(zé)14篇55人關(guān)注

    職位描述:工作職責(zé):1、aml:aliedmachinelearning2、設(shè)計和搭建高可靠的機器學(xué)習(xí)系統(tǒng)3、負(fù)責(zé)機器學(xué)習(xí)服務(wù)各環(huán)節(jié)(樣本生成,樣本管理,模型訓(xùn)練,模型服務(wù),實時更新)的穩(wěn)定運 ...[更多]

sre崗位職責(zé)專題

工程崗位職責(zé)熱門信息