it-swarm-tr.com

En iyi sistem yöneticisi kazası

Yaptığınız sistem yöneticisi kazalarının eğlenceli hikayelerini arıyorum. CEO'nun e-postasını silme, yanlış sabit diski biçimlendirme vb.

Cevap olarak kendi hikayemi ekleyeceğim.

87
Alan H

Linux "killall" komutu (belirtilen adla eşleşen tüm işlemleri öldürür, zombileri durdurmak için yararlıdır) ve solaris "killall" komutu (tüm işlemleri öldürür ve sistemi durdurur, üretim sunucusunu durdurur) yoğun saatlerin ortasında ve tüm iş arkadaşlarınızın size bir hafta boyunca gülmesini sağlamak).

133
Tim Howland

O zamanlar Netscape'in ürünü olan kurumsal web proxy'mizden sorumluydum. Yönetici formlarında oynarken (web tabanlı bir arayüzdü) Kullanıcı Veritabanını Sil yazan büyük (ve kırmızı olduğuna yemin ederim) bir düğme vardı. Sorun değil, diye düşündüm. Ona vurduğumda bana sunduğu seçeneklerin ne olduğunu görelim. Elbette, eğer bir seçenek yoksa bir onay istemi olacaktır.

Evet, onay yok. Seçenek yok. Başka kullanıcı yok.

Bu yüzden Bay Solaris Sysadmin'e gitti ve "O kutuyu desteklemiyorum" diye cevapladığı teypten geri yüklemeye çaresizce ihtiyacım olduğunu söyledi.

"Ah, tekrar gel," diye cevapladım.

"Bu kutuyu desteklemiyorum. Yedek rotasyona eklenecek şeyler listemde ama henüz buralara ulaşmadım."

İnternethaber.com "Bu sunucu yaklaşık 8 aydır üretimde!" Çığlık attım.

omuz silkme , diye yanıtladı. "Afedersiniz."

73
squillman

Yıllar önce çalıştığım şirketin NT 4.0 Server'larının gecelik yedeğini bir Jaz sürücü (yüksek kapasiteli bir Zip diski gibi) üzerinde çalıştıran bir müşterisi vardı.

Gecede planlanmış bir iş olarak çalışan bir toplu iş dosyası kurduk. Her sabah dün gece diskini sürücüden toplarlar ve akşam ayrılmadan önce sıradaki diski takarlardı.

Her neyse, toplu iş dosyası böyle bir şeye benziyordu (Jaz sürücüsü F: idi) ...

@echo off
F:
deltree /y *.*
xcopy <important files> F:

Her neyse, bir gece diski takmayı unuttular. F sürücüsündeki değişiklik başarısız oldu (sürücüde disk yok) ve toplu iş dosyası çalışmaya devam etti. Toplu iş dosyası için varsayılan çalışma dizini? C :. Yedekleme rutinini ilk kez gördüğümde yedeklediği sunucuyu yok ettiniz .

O gün sysadminning (ve istisna yönetimi) hakkında küçük bir şey öğrendim.

Jim.

PS: Düzeltme? "deltree/y F:\*. *".

66
Jim OHalloran

root @ dbhost # find/-name çekirdek -exec rm -f {} \;

Ben: "Giremez misin? Tamam. DB adı nedir?"

Cu: "Çekirdek".

Ben: "Ah."

61
Dave

Herkesin "genç/yeşil olduğumda" hikayesini bir daha asla yapmayacakmış gibi nitelendirmesini seviyorum. En deneyimli profesyonellere bile kazalar olabilir.

Kendi en kötü anım o kadar kötü ki hala düşünen çarpıntılar görüyorum ...

Üzerinde üretim verileri olan bir SAN vardı. Şirket için kritik öneme sahip. “Mentorum”, disk alanını boşaltmak için bir bölümü genişletmeye karar verdi. Bunun nereye gittiğini görebiliyor musunuz? SAN yazılımı bunu canlı olarak yapabilirdi, üretim saatlerinde ve kimse fark etmeyecekti. Alarm zillerinin çalmaya başlamış olması gerekiyordu, ama dikkat çekecek kadar sessizdi. Daha önce hiç sorun olmadan. Ama işte bir şey - beni "emin misiniz?" diyen düğmeyi tıklattı! Şirkette yeni olduğum için bu adamın ne hakkında konuştuğunu bildiğini varsayıyordum. Büyük hata. iyi haber LUN'un genişlemesiydi .. Kötü haber ... iyi, Windows kutusunda disk yazma hataları görmeye başladığımda kötü haberler olduğunu biliyordum.

Kahverengi pantolon giydiğim için memnunum.

Öğle yemeğinde 1 TB'lık verilerin neden kaybolduğunu açıklamak zorunda kaldık. Gerçekten çok kötü bir gündü.

Aslında iyi bir prensip - şüpheleriniz olduğu bir şey yapmadan önce, bir şeyler ters giderse yönetime açıklamak zorunda olduğunuzu hayal edin. İşlemlerinizi açıklamak için iyi bir cevap düşünemiyorsanız, yapmayın.

60
PowerApp101

Nagios, çalışma saatleri kritik olmayan bir sunucuya bağlanamayacağını söylemeye başladığında bir sabah bize ping attı. Tamam, sunucu odasına zam. Bu eski bir sunucu, '02'de satın alınan bir Dell 1650 ve 1650'lerin donanım sorunları yaşadığını biliyorduk. PFY güç düğmesini bıçaklar. Hiçbir şey değil. Bir kez daha vurun ve BMC'nin hata korumasını geçersiz kılan 'gücü açmaya' beş saniye boyunca tutun, çünkü bir DRAC olmadan BMC günlüklerini şasiye güç vermeden incelemenin bir yolu yoktur.

Makine POST'u başlatır ve sonra tekrar ölür. Ben bunun üstünde duruyorum ve "Duman kokusu alıyorum." Sunucuyu Rayları üzerinde çekiyoruz ve güç kaynaklarından biri ısınıyor, bu yüzden PFY onu çekiyor ve kutuyu geri kapatmak üzeredir. "Hayır, bu güç kaynağı dumanı değil, bu anakart dumanı" diyorum.

Davayı tekrar açıyoruz ve yanık kokusunun kaynağını arıyoruz. Bir indüktör bobini ve bir kondansatörün anakart üzerindeki voltaj regülatöründen havaya uçtuğu ve her şeye erimiş bakır ve kapasitör goop'un püskürtülmesi, bir sürü şeyi kısaltması ve temelde büyük bir karışıklık yaratması.

Benim için en kötü yanı, yanmış bir anakartın kokusu ile yanmış bir güç kaynağı arasındaki farkı tanımak için yeterince donanım içtiğimin farkındaydı.

54
Karl Katzke

Üç gün önce (ciddi olarak) Windows Server 2008 dosya sunucusuna Service Pack 2'yi yükleyerek bir okul sunucusunda uzaktan oturum açtım.

Öğretmenlerin yıl sonu karneleri bittikten sonra oturum açmayacakları gece geç saatlerde gerekli yeniden başlatmayı planlamaya karar verdim. Gibi bir şey yazdım:

 at 23:59 "kapatma -r -t 0" 

... ki bu işe yaramış olabilir.

Ama sonra kendimi tahmin ettim. 'Kapatma' sözdizim doğru muydu? Yazarak kullanım yardımını görüntülemeye çalıştım

 kapatma/s 

... ve anında RDP bağlantımı kaybettim. Panik, sözdizimi için Google'a girdim. Hızlı bir arama, Server 2008 kapatma sürümünün (tahmin edebileceğiniz gibi) makineyi hazırda beklettiği bir/h anahtarı içerdiğini ortaya çıkarmıştır.

Öğretmenler, üzerinde çalıştıkları rapor kartlarını açamayacaklarını veya kaydedemeyeceklerini bildirmek için birkaç dakika içinde beni aramaya başladılar. Ben tesis dışında ve sunucu odası kilitli olduğundan, doğrudan okul müdürü aramak ve makineyi tekrar açma işlemi boyunca onu yürümek zorunda kaldı.

Bugün herkese bir özür biçimi olarak ev yapımı kurabiye getirdim.

47
Brent D

Önceki bir işte, şirkete giren, çıkan veya kalan her bir posta parçasını kaydeden ve arşivleyen harika bir ev sistemimiz vardı.

Tüm posta kutunuzu havaya uçurdu mu? Sorun değil! Birinin size bir hafta/ay/yıl önce gönderdiği bir posta parçası mı arıyorsunuz, ancak kimin gönderdiğini veya konunun ne olduğunu hatırlayamıyorsunuz? Sorun değil! Biz sadece Şubat ayından itibaren her şeyi özel bir klasöre yeniden sunacağız.

Bir noktada, şirketin CEO'sunun bir rakip ve dahili bir satış temsilcisi arasındaki postaları şüphe altında izlemesi gerekti. Bu yüzden her gece yayınlanandan bir senaryo hazırladık ve bir önceki günden CEO'ya ilgili postaları teslim ettik. Sorun değil!

Yaklaşık bir ay sonra, çifte artı acil bir problemin sözcüğü yüksekten düştü. CEO, OTHERCOMPANY $ 'a gönderilen postaların listesini okurken, bununla karşılaştı:

To: [email protected]$OTHERCOMPANY
From: CEO
Subject: CEO has read your message (subject line here)

Doğal olarak, CEO önemli bir kişi ve hepsi, Outlook'taki tüm "Okundu Bilgisi Gönder" iletişim kutularını tıklamak için çok meşguldü ve müşterisini sadece hepsini gönderecek şekilde yapılandırmıştı. İzleme filtresinin yakaladığı iletilerden birinde okundu bilgisi isteği ayarlanmıştı. Tahmin et Outlook ne yaptı? Kesinlikle 'gizli' izlemeyi başlattı.

Bir sonraki görevimiz: CEO'dan o şirkete giden okundu bilgilerini engellemek için posta filtresine kurallar eklemek. Evet, en kolay yol buydu. :)

37
MikeyB

Ahhh, benimki yaklaşık 10 yıl önceydi, hala ayaklarımı ıslattığımda. Tüm programcıların bilgisayarlarına yedek pil takmanın sevincini yaşadım. Ayrıca, yazılımın elektrik kesintisi konusunda uyarılmasını ve düzgün bir şekilde kapatılmasını istediler.

Bu yüzden her şeyi test etmek ve her şeyin çalıştığından emin olmak için bilgisayarımda kurdum. Güç kablosunu çıkarırım ve mesaj ekranımda belirir. msgstr "harici güç kesildi, sistem kapanmaya başladı".

Ben de, Hey, harika, işe yaradı diye düşündüm. Ama bazı tuhaf nedenlerden dolayı, hatırlamıyorum bile, o mesajı bir ağ mesajı olarak gönderdi, böylece şirketteki 200'den fazla bilgisayar bu mesajı aldı, burada 100'den fazla kullanıcı programcıların bulunduğu yer.

Evet, kitle ucube hakkında konuş !!

Bir süre başımı aşağıda tuttum!

36
jherlitz

Sık sık Solaris makinelerinde "sys-unconfig" komutunu kullanarak makine Adı hizmetini (I.P. adres ve kök parola. Ben bir kullanıcı sistemi vardı ve ben bina yükleme sunucusuna giriş ve bir şey (kök gibi) baktı, sonra ben başka bir makineye (açıklayıcı olmayan "#" İstemi) giriş yaptığını unutmadan "sys-unconfig" komutunu çalıştırdı.

# sys-unconfig     
        WARNING

This program will unconfigure your system.  It will cause it
to revert to a "blank" system - it will not have a name or know
about other systems or networks.

This program will also halt the system.

Do you want to continue (y/n) ? y

Connection closed

#

Bu "bağlantı kapalı" mesajı yavaşça paniğe dönüştü ... bu komutu çalıştırdığımda hangi makineye giriş yaptım.

Bunun en kötü yanı, çalışma arkadaşlarımın bana verdiği zor zaman değildi, aynı şeyi bir ay sonra yaptım.

35
Alan H

Oldukça iyi bir tane var. Kuşkusuz, bir sysadmin olarak benim zamanımdan önce, ama yine de teknoloji ile ilgili, bu yüzden onu ekleyeceğimi düşündüm.

O günlerde USAF için bir satcom/wideband teknolojisi olarak çalışıyordum. Son zamanlarda teknik okuldan mezun olduktan sonra kendimi Güney Kore'de konuşlu buldum. İstasyona vardıktan kısa bir süre sonra, bir süredir orada olan ve aslında bazı gerçek dünyadaki (yani `` üretim '') ekipman üzerinde çalışan "büyük adamlar" ile güneye doğru seyahat etme fırsatı doğdu.

Mürettebatla birlikte indim ve hevesli, genç bir teknoloji olarak, biraz CANLI askeri ses ve veri trafiğinden geçen gerçek bir ekipman parçasına elimden gelme ihtimaline karşı oldukça heyecanlanıyordum.

Beni yavaşça başlatmak için bana bir el kitabı uzattılar, koruyucu bakım bölümüne döndüler ve birkaç büyük dijital çoklayıcıyla dolu dört raf yönünde işaret ettiler. Ekipman yeterince kolaydı, aynı ekipmanı teknoloji okulunda ele almıştık.

Kılavuzun ilk sayfası okundu; "Ditigal multiplexer'a güç verin. Her iki arka anahtarı ON (AÇIK) konumuna getirin ve ekipmanın açılmasını bekleyin, ardından testlere başlayın." Ben baktım, ve zaten APPLIED güç vardı!

Kesinlikle bir ikilem içindeydim. Nasıl ilerleyeceğimi bilmeden, elimden gelenin en iyisini yaptım, `` Hmmm .. Biraz burada kayboldum '' yaşlıya bak.

Bana baktı ve "Hayır, hayır, sorun değil. Kontrol listesinin o kısmını görmezden gelebilirsin" diye güldü. Sonra, yüzüme baktığını fark ettiğinden, (okulda ASLA öğretilmediğimizden beri, bir kontrol listesinin herhangi bir bölümünü hiç görmezden geldik ve eğer biri bunu yaparsa kesin bir ölüm ve yıkım oldu) ve "SADECE bu kısmı yoksay! Geri kalanını mektuba kadar takip et!" dedi.

Elbette, çok istekli PM talimatlar, bir istiridye gibi mutlu ve bu kadar düşük seviyeli, (akıllı da olsa) bir teknolojinin bu önemli işi yapmasına izin vermekten gurur duydum.

Bu devasa çoklayıcılar üzerinde beşinci ve altıncı önleyici bakım kontrol listesi arasında bir yerlerde, etrafımda artan bir aktivite seviyesi fark etmeye başladım. Telefonlar çalıyordu, insanlar hızla hareket ediyordu. Tuhaf görünümler değiş tokuş ediliyordu.

Sonunda, beni aşağı çeken üst düzey tekniklerden birinin başkanlığında bir grup insan bana doğru koştu.

"Hey! Veri trafiğinde BÜYÜK kesintiler görüyoruz ve üzerinde çalıştığınız raflara giden yolu izole ettik/izledik! Tuhaf görüyor musunuz .."

(Bu noktada, PM'leri gerçekleştirdiğim ilk çoklayıcı grubuna doğru yol alan sorun gidericilerden biri tarafından kesildi.)

"KUTSAL SOMUNLAR! KAPATILDI! BUNLARI KAPATIYOR !!!!"

Kısacası, kılavuzdaki ilk adımdan aceleyle koşarken izledim, "Her iki arka anahtarı da AÇIK konuma getirin ..." Üst düzey teknoloji tamamlandığında bana geldi ve ne düşündüğümü inanılmaz bir şekilde sordu kritik ekipman parçalarını kapatarak.

Zekâlarımdan korktum, ona takip ettiğim kontrol listesini verdim, TÜM'de sapmadığım için yemin ettim. Onu takip etmiştim, talimat verdiği gibi `` mektuba ''.

Bir süre sonra güldü ve sorunun nerede yattığını gösterdi.

Kılavuzda, koruyucu bakım kontrol listesindeki FINAL adımı şuydu:

"Son prob okumasını kaydedin, ön paneli silin, tüm tozları ve partikülleri temizleyin, ardından her iki arka güç anahtarını KAPALI konuma çevirin."

:)

27
Greg Meehan

Birisi için bir sistemi yeniden yükliyordum ve manuel yedekleme işlemi sırasında ona "Kullandığınız başka programlarınız var mı?" ve "Bilgisayarda yaptığınız başka önemli bir şey var mı?"

O, "hayır" dedi.

Sürücüyü ikna ettim ve biçimlendirdim.

Yaklaşık 30 dakika sonra "aman tanrım" dedi ve iki elini de kafasına koydu.

Özel bir programda 10 yıldan fazla bir süredir kitap senaryosu üzerinde çalıştığı anlaşılıyor. Bu, programlar kullanıcı verilerini program dosyaları dizinine kaydetmek için kullanıldığında geri döndü ve kaçırdım.

Whhhhooooops.

Bana kızgın değildi, ama ayık bir duyguydu.

26
MathewC

Bu bir tür sisadmin kazasıdır ... Sysadminler zaman zaman A noktasından B noktasına çok sayıda makineyi fiziksel olarak çekmek zorunda kaldıkları sürece (A ve B görünüşte her zaman asansörsüz bir binada birkaç merdivenle ayrılır). Günün n. Seyahatinde, aşağı inen biriyle sohbet etmek için bodrum yükleme seviyesinden üç uçuş için durdum, açık merdiven boşluğunun iç korkulukunda çaldığım tam boy kuleyi destekledim ve ... iyi, tahmin ettiniz ... üzerindeki tutumu biraz kaybettim. Kuyudan aşağıya doğru düz bir şekilde daldı ve dibe ulaştığında, er ... bunun için işlevsellik ile çok fazla değil! Toplam kurtarılabilir parçalar: iki adet RAM, bir disket sürücü ve bir ISDN kartı (Tanrı Hermstedt mühendislik milletini korusun!). Diğer her şey çatlamış, tıkırdamış veya küçük parçalara ayrılmıştı.

Tanrı'nın lütfuyla, altında kimse yürümedi, şükürler olsun ki benim için patronum ilk oldu, bu yüzden işimi sürdürmem gerekiyordu. Bir saat kadar çok hasta hissettim.

Ahlaki: yerçekimi her zaman kazanır!

26
avstrallen

Benim kişisel favorim aslında benim değil ve bundan çok memnunum. Buraya bir göz atın.

23
RainyRat

Bu bana olmadı, ama…

İstemci tarafından sağlanan Linux makinelerinde çalışan yazılımlar üreten bir şirkette çalışıyordum. Esasen makineleri 'devralacak', tamamen teknik özelliklerimize göre yapılandıracak ve tüm yönetim ve izlemeyi yapacağız. Esasen, yüzlerce müşteri için binlerce sunucuyu yöneten 10-15 sistem yöneticilerinden oluşan bir ekibiz. Hatalar gerçekleşmek zorundaydı.

Ekibimizden biri bir sunucuda bazı sorunlar buldu (bir yedek, sanırım) ve onun üzerinde fsck çalıştırması gerektiğine karar verdi. İlgili tüm hizmetleri durdurdu, sistemin yakın zamanda yedek aldığından emin oldu ve sonra fsck'i çalıştırdı, ancak dosya sisteminin monte edildiğinden şikayet etti. Uzak olduğumuzdan ve uzaktan erişimimiz olmadığından (DRAC, ILO, vb.), Fsck'i yapamadı, ancak dikkatli olsaydınız, dosya sistemi takılıyken bunu yapmanın güvenli olduğundan emindi.

Öngörülebilir sonuçlarla kök bölümünde fsck çalıştırarak kendisini denemeye karar verdi - kök bölümünü bozdu ve artık önyükleme yapamadı.

Şaşkın, gitti ve takım liderimizle konuştu. Lider, bunu yapamayacağından oldukça emin olduğunu söyledi ve ekip üyesi 'Elbette yapabilirsin!' Dedi, liderin klavyesini aldı ve kurşunun kök bölümünde fsck çalıştırarak yapabileceğinizi gösterdi. Hangi tamamen bozuk HIS kök bölümü.

Sonuç? Ekip üyesinin testi sayesinde müşteri verisi kaybı olmadı. İki günlük çalışan verimliliği kayboldu, ancak bu müşterinin makinesindeki verilerden çok daha az değdi. Peki kayıt için? Bağlı bir sürücüde fsck'i çalıştırabilirsiniz, ancak yalnızca verileri doğrulamak için. Tamir etmemek. Takım üyesinin hatası buydu.

-

Kendi hikayemi eklemek için aynı şirkette çalışıyordum ve bir kullanıcı şifresini sıfırlamaya çalışıyordum. Sistemimiz eski şifre karmasını izlediğinden şifreyi ayarlamama izin vermedi ve şifreyi çoğaltmanıza izin vermedi. Mekanizma basitti: şifrenizi veritabanındaki en son karmaya karşı doğruladı.

(Ve kayıt için, eski bir şifre olması gerekiyordu çünkü paylaşılan bir hesaptı ve herkesin yeni şifrenin pratik olmadığını bildiğinden emin olmak)

Kullanıcı veritabanına girmeye ve yeni kayıtları silmeye karar verdim, böylece eskisini kullanacaktım. Hepsi sadece SQL (Sybase'in eski bir sürümünü çalıştırıyor), bu yüzden kolay. İlk olarak, kayıtları bulmak zorundaydım:

SELECT * FROM users_passwords WHERE username='someuser';

Saklamak istediği eski kaydı buldum; önünde iki tane daha vardı. Akıllı olmaya ve eski kayıttan daha yeni bir şeyi silmeye karar verdim. Sonuç kümesine baktığımda, eski parolanın veritabanında ID # 28 olduğunu ve yenilerinin ID #several bin (çok meşgul sistem) olduğunu gördüm. Bu basit, tüm eski satırlar 28'den büyüktü, bu yüzden:

DELETE FROM users_passwords WHERE id > 28;

Basit bir sıra budaması yapmak ve '212.500 satır etkilenmiş' görmek daha kötü bir şey değildir. Neyse ki, iki ana veritabanı sunucumuz vardı (kullanıcı kimliğiyle), ancak Sybase (en azından sürümümüz) otomatik çoğaltmayı desteklemedi, bu nedenle eski kayıtları otomatik olarak silmedi. Users_passwords tablosunun dökümünü alıp yeniden içe aktarmak çok önemli bir konuydu. Yine de oldukça büyük bir 'oh f ** k!' an.

23
Dan Udey

Kök olarak kill 1 Yazdı. init ve tüm çocukları öldü. Ve tüm çocukları. vs, vs. Hata!.

Yazmak istediğim kill %1

Ne yaptığımı anladıktan sonra bir BÜYÜK yün balya ayırma makinesinin kontrol paneline koştum ve acil durdurma düğmesine basın. Bu, makineyi kontrol eden yazılımı henüz öldürdüğüm için makineyi parçalara ayırdı.

22
Jason Tan

Müşterilerin canlı kullanıcı veritabanında WHERE yan tümcesi olmadan DELETE ifadesi.

22
Ian Boyd

Favorilerimden bir diğeri:

Bir sistemi ve yerel bir lazer yazıcıyı bir sisteme kurarken, her ikisini de bilgisayarın UPS'sine bağlamak için parlak bir fikrim vardı. Hiç bir masaüstü UPS'e bağlıyken yerel bir lazer yazıcıya yazdırmayı denediniz mi? Eğer bilmiyorsanız, tüm amplifikatörleri çekme eğilimindedir ... Bu da bilgisayarı yeniden başlatır ... Ve yazdırma işi asla bitmez ...!

Çağrıyı hiç almayın: 'Ne zaman yazdırsam, bilgisayarımı yeniden başlatır ve yazdırmaz !!!'?

Posta ile gönder

JFV

22
JFV

Bir elektrik kesintisinin ortasındaydık ve UPS'in yapılandırılmış yükünün% 112'sinde çalıştığını gördük. O zaman jeneratörde çalıştığımız için bu pek bir sorun değildi.

Bu yüzden, UPS'deki güç kullanımını azaltmak için yedek güç kablolarını çekerek dolaştık (biri diğerinden çok daha büyük olan iki tane vardı). Biz sunucu odası koştu ağ anahtarı var (bu müşteri için sunucu başka bir sunucu odasında karşı karşıya şirket ile tüm iç sunucu ile sunucu odası). Anahtar, içinde üç güç kaynağı bulunan büyük bir kurumsal sınıf anahtarıydı. Malzemeleri N + 1 vardı, bu yüzden sadece iki anahtarı çalıştırmak için gerekli.

Bir kablo seçtik ve çıkardık. Ne yazık ki bizim için diğer ikisi, yük takılı olan iki güç kaynağına çıktıkça hemen patlayan tek bir güç şeridine takıldı. Sisadmin daha sonra panikledi ve üçüncü kabloyu taktı. Anahtar yanmaya çalıştı ve anahtarın tüm yükünü tek bir güç kaynağına koydu. Güç kaynağının kapatılması yerine, yüzümden 12 inç olmayan kıvılcım duşunda patladı ve beni sunucu rafına geri attı.

İçgüdüsel olarak yan tarafa atlamaya çalıştım, ama ne yazık ki solumda bir duvar vardı ve iki sağım çok büyük bir 6'4 "tesis adamıydı. rafa bir bütün koymadan ve tesis adamına dokunmadan Compaq raflarının (ince örgü cephelere sahip olanlar).

21
mrdenny

Kariyerimin bir noktasında çalıştığım şirkette yapılan yasal bir soruşturma, aksi belirtilmedikçe, tüm e-postaların "bu gün" ten ileriye doğru tutulması gerektiğini belirtti. Değişim ortamımızın (tam olarak 1 TB) günlük tam yedeklerini yaklaşık bir yıl sakladıktan sonra yer kalmaya başladık.

Değişim yöneticileri, e-postanın yalnızca 8. kopyasını tutmamızı önerdi. Bunu yapmak için, bir günlük değişim veritabanlarını geri yüklemelerini, ihtiyaç duydukları e-postayı (soruşturma için işaretlenen belirli kişiler) ayıkladık ve yeniden arşivledik. Bunu, tüm yedeklemelerimiz için her 8 günlük e-posta için yaptılar. 8. gün seçildi, çünkü borsada "silinmiş öğeler" in 8 gün boyunca veritabanında tutulduğu bir parametre seti vardı.

Her arşivi bitirdikten sonra, geri dönüp arşivlediklerinden daha eski olan tüm yedekleri silerim.

TSM'nin bunu yapmanın kolay bir yolu yoktur, bu nedenle nesneleri yedekleme veritabanından manuel olarak silmeniz gerekir.

Bugün ve söz konusu tarih arasındaki farkı kullanarak bir tarih hesaplaması yoluyla bir tarihten daha eski olan tüm yedekleri silecek bir komut dosyası yazdım. Bir gün yaklaşık bir aylık yedeklemeleri silmek zorunda kaldım, ancak tarih hesaplaması yaptığımda bir yazım hatası yaptım ve tarihi 6/10/2007 yerine 7/10/2007 olarak girdim ve senaryoyu çalıştırdım. Ekstra bir aylık veriyi yanlışlıkla sildim, bu da çok önemli bir davanın parçasıydı.

Bundan sonra, verileri silmek istediğinizi onaylamak için komut dosyasına bazı adımlar ekledim ve size ne sileceğini gösterdim ...

Neyse ki, korumak için çok çalıştığımız hiçbir veriyi hiç kullanmadılar ve hala işim var.

20
WerkkreW

Uzun bir gün veya performans izleme ve büyük bir anabilgisayarın ayarlanmasından sonra (tüm yedek yedekleme sitelerinin gerçekten yeniden başlatıldığını ve tamamen senkronize olduğunu kabul etmeden önce birkaç saat süren canavarları biliyorsunuz) Parmaklarımı uzattım, memnun kapatma yazdım -p şimdi dizüstü bilgisayarımda İstemi, kapağı kapattı, seri kabloyu anabilgisayardan çekti, güzel bir soğuk lager beklentisiyle.

Aniden dizüstü bilgisayarım hala mutlu bir şekilde X'i görüntülerken anabilgisayarı aşağı doğru döndürmenin sağır edici sesini duyuyorum.

Makinenin tekrar tamamen çevrimiçi olmasını beklerken ACPI'mın dizüstü bilgisayarımda çalışmasını sağlamak için zamanım olduğuna karar verdim, böylece dizüstü bilgisayarımı kapatmak için hiç cazip olmadım.

20

Birisinin hesabını yanlışlıkla sildim, silmek istediğim adlarla karıştırıldım. Opps

Güzel tarafı ne olduğunu hiç bilmiyorlardı. Giriş yapamadıkları çağrıyı aldım, kuruş sildiğim hesap hakkında düştü.

Onlarla telefonda iken, hesaplarını hızlı bir şekilde yeniden oluşturdum, eski posta kutularını tekrar ekledim (çok şükür ki Exchange posta kutularını hemen silmez) ve eski kullanıcı dosyalarına geri yönlendirdim.

Sonra onlar için sıfırladıkları şifrelerini unuttukları için onları suçladım :)

16
SpaceManSpiff

Yanlışlıkla Gentoo Linux kutuma bir tar.gz dosyası yükledim ve dosyaları her yerde bıraktı. Bu, o zamanlar 1999, 19 civarında olmalıydı (aşağıdaki yorumlar için teşekkürler)

Ben olduğum bir inek olarak, kendimi her dosyaya manuel olarak gitme işinden çıkmaya karar verdim.

Bu yüzden denedim:

tar --list evilevilpackage.tar.gz | xargs rm -rf

Katranın programın kullandığı tüm dizinleri de listelediğini fark etmem çok uzun sürmedi, dahil olanlar ''/usr,/var,/etc '' ve gerçekten gitmesini istemediğim diğer birkaç kişiydi.

CTRL-C! CTRL-C! CTRL-C! Çok geç! Her şey gitti, zamanı yeniden kur. Neyse ki kutuda önemli bir şey yoktu.

16
Andrioid

Bu kaza olmadı ... ama bahsetmeye değer:

Yeni bir devrede bant genişliği testleri yapmak için yoğun olarak kullanılan bir veri merkezine gönderildim. Demarc odasına/IDF'ye gittim, test yönlendiricim için raflardan birinde bir yer buldum, bağlantılarımı kurdum ve testleri başlattım. Ne yazık ki, üretim sınır sınır yönlendiricisini sadece bir sonraki rafta (neredeyse aynı seviyede) değil, aynı zamanda test yönlendiricimle aynı marka ve model olarak fark etmedim.

Test tamamlandığında, güç anahtarını kapalı konuma getirmeye başladım (... yavaş çekimde hayal edin ...) ve yemin ederim, tıpkı baskı uyguladığımda yönlendiricinin üzerimde olduğunu sordum üretimde kapatmak içindi. Kalbim durdu ve neredeyse ... hayal gücünüzü kullanıyorum.

Veri merkezinin MDF ürkütücü ve solgun görünüyordu, ama aynı zamanda hala bir işim vardı sevindim!

16
l0c0b0x

Eski hayatımın ufacık bir parçası olarak şirketin dosya sunucusunu, bir ağ yazılımı 4:11 kutusunu yönettim. HİÇBİR herhangi bir girdiye neredeyse hiç ihtiyacı yoktu, ancak eğer öyleyse, uzak bir konsol penceresi açtınız.

DOS'u her zaman kullanıyordum, bitirdiğimde doğal olarak "Exit" yazardım. Netware için, "exit" işletim sistemini kapatma komutudur. Neyse ki, sunucuyu ilk "Kapatmadıkça" kapatmanıza izin vermeyecektir. (Ağa/istemcilere erişilemez olmasını sağlayın) Bu nedenle, konsolda "Çıkış" yazdığınızda, "Önce yazmanız gerekir" Aşağı "çıkmadan önce"

Konsol oturumuna kaç kez "1" yazdım ve 2: "Yapmaya çalıştığım işi bitirebilmem" için "Aşağı" ve sonra "Çıkış" yazdığımdan kaç kez sor.

Ve sonra telefon çalmaya başlar .....

LOL

12
Bob

Çalıştığım son yer, iş arkadaşımın çocuklarını onunla birlikte sunucu odasında geçirdi (neden? HİÇBİR FİKRİM YOK!).

Sunuculardan çok uzakta olduklarından emin oldu ve 5 yaşındaki çocuğuna sunucuların HERHANGİ BİRİNE dokunmaması gerektiğini ve özellikle de güç anahtarlarının hiçbirine açık olmadığını söyledi.

Aslında, onları hemen kapının yanında tuttu ... (bunun nereye gittiğini görebiliyor musun ...?)

Oğlan sunucu güç düğmelerinin hiçbirine dokunmadı ... Hayır, bunu açıklamak çok kolay olurdu. Bunun yerine, kapının yanında bulunan BÜYÜK KIRMIZI DÜĞMEYE çarptı ... TÜM SUNUCU ODASINA gücü kapatan düğme !!!

Telefon hatları hemen değişmeye başladı ve Exchange, Dosya Sunucuları vb. Neden bulunmadığını merak etti ... Bunu CEO'ya açıklamaya çalıştığınızı hayal edin!

-JFV

11
JFV

Olmayan başka bir hikaye (vay):

Her gün bir teyp sürücüsüne dini olarak artımlı yedeklemeler yapıyorduk.

Başkasına göndermek için veri içeren bir teyp yazdık. 'Kasetini okuyamayız' dediler. Aslında biz de yapamadık. Ya da aslında herhangi bir kaset.

Başka bir teyp sürücüsü aldık ve yükleyene kadar nefesimizi tuttuk.

Hikayeden çıkarılacak ders. Daima yedeklerinizi test ettiğinizden emin olun.

11
Matthew Farwell

Bir zamanlar APC UPS izleme yazılımı ile kavga ettim. Küçük bir şirket olarak, birkaç küçük-ish UPS vardı ve çeşitli sunucular onları izlemek için ayarlandı. Sunucuların çoğu Linux'taydı, ancak birkaçı Windows çalıştırıyordu ve bu yüzden kullanılanlardı, çünkü APC yazılımı sadece Windows.

Bununla birlikte, o sırada APC yazılımı, konuştuğu UPS'nin PC'yi de çalıştırdığını varsaymak için sabit olarak kodlandı! Bu sunucu için durum böyle değildi, ama bunu durdurmak için söylemek için çok geç keşfettim. Ayrıca ne yazık ki, lider programcı şirket ürününü bir ortağa gösteriyor - aynı sunucuda çalışan web tabanlı bir uygulama oldu, APC yazılımının kapanmasını istemedim ...

10
staticsan

Kuzey Amerika'da bir kablosuz sağlayıcı için çalışıyorum ve grubumdaki bir kişinin iş emirlerini yerine getirmesi için biraz eğitim yapmıştım. Ben ilk birkaç gece kalmıştı (bakım penceresi sırasında her şeyi yapıyoruz), ama o iyi yapıyordu ve kendi başına öğrenmek zorunda olduğunu söyledi, bu yüzden izin ve cep telefonu ve çağrı cihazı bıraktı. Ertesi sabah saat 8'de kalktığımda giriş yaptım ve yapılandırmayı kontrol ettim.

Değişiklik, BlackBerrys için yeni bir IP adresi havuzu ekliyordu, eklediğimiz havuz yaklaşık 10000 adresdi. Bunu yapmak için, yönlendiriciye tüm çağrı işlemlerini yapan bir blade'deki işlemci adresini gösteren yollar ekliyoruz (esas olarak bir proxy gibi çalışır). Ayrıca, işlemcide oturum açar ve IP havuzunu yapılandırır ve kablosuz kullanıcılarımız için kullanılacak IP havuzunu bağlarız. Bununla birlikte, test için, bunu normalde tek bir işlemcide yapılandırırız (aslında bir telefonu önyükler ve tüm özellikleri test ederiz) ve ardından yapılandırmayı istediğimiz gerçek işlemciye taşırız.

İki hafta hızlıca ilerleyin ve kontrol merkezimizden aralıklı BlackBerry sorunları hakkında çok fazla çağrı yapıldığı ve aradıkları birkaç BlackBerry'nin ortak bir havuzda bisiklet sürdüğü, ancak değildi ne olduğundan gerçekten eminim. Bu meslektaşım sadece iki hafta önce eklediğim yeni havuz olduğunu anlamak sadece 5 dakika sürdü. Ayrıca, yönlendiricinin bir tanesi test işlemcisine, diğeri de uygun çağrı işlemcisine giden iki yol olduğunu görmek uzun sürmedi. Bu, test işlemcisine giden rotayı silmeyi unuttu ve uygun rotayı aştı.

Esasen bir BlackBerry ağa bağlanır, IP adresini almak için proxy'ye bağlanır, proxy havuzdan yanlış rotayla bir adres verir ve BlackBerry RIM rölesi, ve yanıt test proxy'sine yönlendirilecek ve asla kullanıcıya geri döndürülmeyecek, aslında bağlantı yok demektir.

Blackerrys'in röle ile iletişim kuramazlarsa, ağın bağlantısını kesecek/yeniden bağlanacakları bir davranışa sahip oldukları için şanslıydık, ancak yine de bazı RIM cihazlarının çalışma döngüsüne kadar birkaç saate kadar hizmetsiz kaldıkları havuzu. Geri düşündüm ve işi iki kez kontrol ettiğimde, sadece bu adam için yeni olan proxy yapılandırmasını kontrol ettim, bu adam daha önce omurga takımı ile olduğu için yönlendirme konfigürasyonunu hiç kontrol etmedim ve yönlendirme onun işiydi. Hata!

Onu düzelttim ve öğleden sonra onu aradım, günü iyi gidiyordu, ama başladım üzgünüm, ama bütün hafta seni mahvetmek üzereyim. Bir yıl sonra hikaye hala biraların etrafında ortaya çıkıyor.

8
Kevin Nisbet

Bir rafın arkasına sıkışmış bir kule sunucusunu takıp aşağı doğru giderken ana Cisco yönlendiricinin arkasına kafamı vurarak. Böylece güç kablolarının gerçekte ne kadar gevşek oturduğunu ortaya çıkarmak Catalyst 65 .

Evet. Şimdi sunucu odasındaki bir kancada kaskımız var. Üzerinde ismimle.

8
Bill B

Yeni bir sysadmin'e Service Manager uygulaması turu veriyordum. "Bu hizmeti durdurmanız gerektiğinde bu düğmeyi tıklarsınız, ancak bunu gün içinde asla yapmamalısınız" dedim. Fare düğmesinin ne kadar hassas olduğuna asla inanamazsınız!

İki dakika sonra servis yeniden başlamıştı ve kimse fark etmemiş gibiydi.

8
Antony

Teyzem bilgisayarlarını düzeltmemi istedi. Açılmayacağını ve 2 hafta boyunca böyle olduğunu söylediler. BIOS ya da işletim sistemi olduğundan şüphelendim.

Bilgisayarlarının önüne oturdum. Güç düğmesine basmak için çömeldim. Ben bakarım.

BIOS geçti. Bu iyi.

İşletim sistemi önyüklendi. Bu iyi.

Fareyi, girdi aygıtlarında bir sorun olduğunu düşünerek hareket ettirdim. Giriş cihazlarında bir sorun yoktu.

Word işlemcisini açtım. Koştu.

Yazıcıyı test ediyorum. Yazdırdı.

Bu noktada, ayağa kalktım ve teyzeme (kim beni izliyordu) bilgisayarla ilgili bir sorun olmadığını söyledim. Oturmadan önce böyle olmadığını iddia etti.

Şimdi aileme o kadar çok olduğumu iddia edebilirim iyi, sadece önünde oturarak herhangi bir bilgisayarı düzeltebilirim.

7
MrValdez

İlk yönetici tarafından sysadmin olarak işe alındığımda ... ilk hafta içinde yepyeni bir Dell sunucusu aldık ... Windows Server 2003 ... gizlice gece yarısı sunucu odasına çağrılıncaya kadar onun küçük bebeğiydi. ANTIVIRUS OLMADAN dağıtımdan önce WEB SURFING çünkü bir Cumartesi gecesi ondan çok sayıda kötü amaçlı yazılım temizlemek için !!!

Kötü amaçlı yazılım temizleme çok deneyime sahip bir şey, ama bu bir sunucu olduğu için bir biçim yaptım ve ekstra güvenli olmak için yeniden yükleyin.

Ona asla bir Söz söylemedim. Kraliyetle uğraştığını biliyordu.

7
cop1152

Bir sistem yönetiminden daha kişisel bir komut dosyası, ama ...

Şimdi Banshee bilgi oynamak ve almak "xte" programını kullanarak klavye olayları olarak karakter karakter girmek bir makro gibi davranmak için Perl komut dosyası yazıyordu. Bu şekilde, özel bir etkileşim olmadan programlar içinde çalışmasını sağlayabilirdim, tıpkı yazdığım gibi olurdu.

Şey, neredeyse mükemmel bir şekilde kodladım. Rastgele bir oyunda denemeye karar verdim. Sohbeti başlatmak için tuşa basış shift + enter. Şimdi bunu yapabilmek için basılı tutmam gerekiyordu shift, basın enter, Sonra serbest bırakın shift. Ne yazık ki acelemde "serbest bırakma kaymasını" unuttum. Senaryoyu çalıştırdım ve bu, shift tuşumun kilitlenmesinin biraz komik yan etkisine yol açtı. "Sorun değil, sadece terminale gideceğim ve vardiyayı serbest bırakmak için satırı elle yazacağım" diye düşündüm. Ne yazık ki, herkesin bildiği gibi, Linux büyük/küçük harfe duyarlıdır. Komutu girmek zorunda olduğum gibi tüm büyük harflerde kabul etmeyecekti. "Karşı-vites" ya da bunun gibi bir şey yapamadım.

Bu, web sitelerini ziyaret etmem ve kapatmak için gereken komutu oluşturmak için ayrı ayrı küçük harfleri terminale kopyalamak + yapıştırmak için fareyi kullanarak beş dakikalık çöpçü avına yol açtı.

7
DWilliams

Büyük bir sorun değil, ama yaklaşık 10 yıl önce kesinlikle bir 'Yüzümde yumurta' sabahı. Eski donanım envanterinden geçiyordum ve donanımın boşaltılması için hazır diskleri yeniden görüntülüyordum. Bunu yapmanın en etkili yolunu bulmaya çalışırken, Norton Ghost'un bir kopyasını ve uygulanacak görüntüyü içeren bir CDRom oluşturdum. Makineyi açtınız ve POST işlemi sırasında CD'yi sürücüye yerleştirin. Makine CD'den önyükleme yapar ve kendini otomatik olarak yeniden görüntüler. İyi çalıştı.

Sorun, CD'nin kopyalarını hazırlarken geldi, böylece paralel olarak daha fazla makine alabildim. Son CD'yi yazmayı bitirdim, masaüstü bilgisayarımı kapattım ve gün boyunca eve gittim. Ertesi sabah ne olduğunu tahmin edebilirsiniz. İçeri girdim, bilgisayarımı açtım ve gittim ve bir kahve yaptım ...

Bir nedenden dolayı geri döndüğümde makinem alan adının dışındaydı ve şifremi kabul etmiyordu ...

Sadece olanlar için çalışmıştım ve diğer erkekler güne geldiğinde küfür etmeye başlamıştım. Evet, bir süreliğine yaşamaya izin vermediler.

7
Sam

Gün içinde, çok yeşil olduğumda, hiç kimsenin sahip olmadığı göründüğünden, kullanıcıların bilgisayarlarına AV yazılımı yüklemem gerekiyordu. Bu yüzden, 40 veya 50 masaüstünü alay etmek yerine uzaktan kurulumun nasıl yapılacağını bulmak için biraz zaman harcadım. Uzaktan kurulum mükemmel bir şekilde çalıştı ve çeşitli yöneticiler giriş yapamadıklarından şikayet etmek için ofisim tarafından bırakılana kadar her şey iyi görünüyordu.

Birkaç kişinin makinelerinde Symantec AV'nin yüklü olduğu ortaya çıktı ve bu, kullandığım McAfee yazılımı ile iyi bir şekilde bir arada bulunmadı ve bir giriş denemesinden sonra makineleri kilitleyecekti.

Neyse ki, giriş yapmadan önce makineye ulaşırsanız hizmeti uzaktan devre dışı bırakmak mümkün oldu, bu yüzden üst düzey yönetimlerin tüm bilgisayarlarını yeniden oluşturmak yerine düzeltmek için puan almayı başardım ...

7
user2278
6
Rook

Çalışanımdan biri tarafından yapıldı ... Sunucularınızı neden açıkça etiketlediğinizin mükemmel örneği:

Çalışanım ikincil MSSQL veritabanı sunucusunu (üzerinde mevcut veri olmayan) yeniden oluşturmak için colo'ya gönderdi. Birincil olan aktif olarak kullanılıyordu. Muhtemelen bu hikayenin geri kalanını tahmin edebilirsiniz ... Bir kez orada, sunucuyu yeniden başlattı, kurulumu başlattı ve sürücüleri yeniden biçimlendirdi, sadece onu aramamı ve birincil veritabanı sunucusunun neden artık yanıt vermediğini sormamı sağladı. (SB)

6
skraggy

Benimki sadece 6 ay önce oldu. PHP/MySQL web uygulaması için yeni bir sunucuya geçtik. İşletim sistemini seçmem gerektiğinden, en çok tanıdığım/rahat olduğum olanı seçtim: Ubuntu.

Saatlik, günlük vb. Olarak cron tarafından çalıştırılacak bir dizi yedek komut dosyamız vardı. Geçiş mükemmel gitti. MySQL DB'yi eski sunucudan yenisine aktarırken ve IP'leri değiştirirken yaklaşık 2 dakikalık kesinti süresi vardı.

Ancak birkaç hafta sonra komut satırında MySQL'de çalışıyordum ve artık gerekli olmayan bazı eski test kayıtlarını siliyordum. İlk önce bir programcı olduğum için, sysadmin ikinci olarak, önce noktalı virgül (;) yazıp sonra komutu yazmayı alışkanlık haline getirdim. WHERE yan tümcesini DELETE sorgusuma eklemek üzereyken, yanlışlıkla enter tuşuna bastım. ... ayy.

Query OK, 649 rows affected (0.00 sec)

"Önemli değil," diye düşündüm. "Saatlik yedekleme 4 dakika önce tamamlandı. Toplam 3 kayıt kaybolabilir. Hızla yedekleme dizinine gidip geri yükledim. Sorun çözüldü.

... Sonra yedeklemedeki zaman damgasını fark ettim. 17 günlüktü. Başka yedek yoktu. 17 gün önce girilen sistemdeki her şeyi sildim.

Ubuntu'nun cron arka plan programında, adın herhangi bir yerinde bir nokta (.) İçeren bir komut dosyası çalıştırmamasına neden olan bir hata olduğu ortaya çıkıyor. Bir hata yaratmaz, bu nedenle bir sorunun kanıtı yoktur. Sadece çalıştırmayı reddediyor. Tüm yedekleme komut dosyalarımızın adlarında noktalar vardı. Daha önce mükemmel çalıştılar, ama şimdi değillerdi.

Öğrendiğim dersler:

  1. Sorguyu gerçekten çalıştırmak isteyene kadar noktalı virgül MySQL'in komut satırına koymayın.
  2. Yedek dosyalarınızdaki zaman damgasını kontrol edin önce geri yükleme.
  3. Yedek komut dosyalarınızı test edin ve gerçekten çalıştıklarından emin olun.
6
Andrew Ensley

Düşünmek istediğimden daha uzun bir süre önce şirketin teknik kişisiydim ve bazı danışmanlarla uygulamalarını yükledim. Donanım bir DEC VAX idi ve bir HSC50 depolama sunucusu kullandı. Danışmanlar yüklemeleri ile günün çoğunu aldı ve ayrıldıktan sonra, sistem diskini HSC50'nin bit-bit-bit kopyalama yardımcı programını kullanarak boş bir diske yedeklemeye karar verdim. Kopyalama tamamlandıktan ve yeniden başlatmayı denedikten sonra, kaynak ve hedef diskin adlarını tersine çevirdiğimi ve böylece boş diski bit için sistem diskine yedeklediğimi keşfettim.

Sistem diskinde VMS'yi yeniden oluşturmayı ve uygulamanın çoğunu yeniden yükleyebildim, ancak bence hiç de işe yaramadı. O zamandan beri, eğer bir kopyalama/yedekleme/vb. Yapıyordum, devam etmeden önce kaynak diski yazmaya karşı koruyacağım. (Artık yazmaya karşı koruma anahtarları artık olmadığına göre, önce Return tuşuna basıyorum komutuna bakıyorum.)

6
JonP

Bir Windows makinesinden gelen ve izleme sisteminin lisans dosyasının olmadığını belirten bir uyarıyı araştırmak için çağrıldım. Komut İstemi komutunu açtım ve sorunu araştırmaya başladım ve temel windows komutlarının orada olmadığını gördüm.

Bir komut dosyasını uzaktan çalıştıran bir sysadmin, kök ve alt klasör tarafından belirtilen klasörü Ortam Değişkenleri'nde belirtilen klasörlerle silmek için del komutunu kullanan bir komut dosyası yazmıştı. Ortam Değişkenleri ayarlanmadıysa, tüm bölümü sessizce sildi.

Söylendiğinde, sysadmin, söz konusu komut dosyasını kendi not defterlerinde çalıştırarak, böylece de çöp kutusuna dökerek eylemi onayladıklarına şaşırdı.

Şaşırtıcı olan şey, biz sunucuyu yeniden başlatana kadar Windows iyi çalışıyor oldu. Sadece cimri izleme yazılımı şikayet etti.

Bir siyasi parti için ikincil Active Directory sunucusuydu. Hata.

5
Stuart Woodward

Bazı BitTorrent indirmelerini hızlandırmak için güvenlik duvarına bypass kuralı ekleme. Kullanılan baypas kuralının çok kararlı olmadığı ortaya çıktı ve güvenlik duvarını yıktı. Bu, her okulun şehirdeki İnternet bağlantısı için bir sınır güvenlik duvarıydı. Daha da kötüsü, yeniden başlatma sadece güvenlik duvarının sabit diskinin ölmesine neden olacaktı. Eğlenceli? Çok değil. Muhteşem başarısızlık? Kesinlikle.

4
Mark

Benimki bir etiket ekibi çabasıydı.

Yönetim tarafından bir çeşit temizlik yapabilmek için DBA'larımızdan birini bir sunucuya kaydetmem talimatı verildi. Sorgusunu çalıştırdı ve hemen her iki çağrı cihazımız da gitti, bu da ikimizden de küfürler istedi.

Anlaşıldığı gibi, temizleme aslında veritabanının bir damlasıydı ve geliştirme sunucularından birinde yapılması gerekiyordu. Ancak, aldığım talimatlar, bunun üretimde gerçekleşmesi gereken küçük bir temizleme görevi olduğuna inanmamı sağladı.

Neyse ki, minimum veri kaybı ile yedeklemeden geri yükleyebildik.

Alınan ders: Üretim sunucularıyla uğraşırken HER ZAMAN tam olarak ne yaptığınızı bildiğinizden emin olun. Belirsizlik varsa, en iyisi clairification almanızdır.

4
Bill B

Tamam. Almak & ABD klavyesinde Shift-7 tuşlarına basın. İsveççe bir klavyede almak için Shift-6 tuşlarına basın. Peki, İsveç klavyesinde Shift-7 tuşlarına bastığınızda ne elde edersiniz? Siz /.

Yıllar önce İsveç mizanpajları o kadar yaygın değildi. Kişisel tercihim ABD düzenini kullanmaktı. Bir gün bir dizindeki bir grup dosyayı ve alt dizini silmek istedim.

Vurdum:

rm -fr *

Ama çok yavaştı, bu yüzden çabucak vurdum:

Ctrl-C rm -fr * &

Yoksa ben mi? Ben yapmadım. İsveççe bir klavyede olduğumu fark etmem birkaç saniye sürdü. Ne olduğunu çözmek için yukarıya bakın. Ve bu felaket bir gerçekti.

Komuta öğrendiğim gün buydu:

dd

En sonunda diskten kasete geçmeyi başardım, sadece bütün gece sürdü. Ertesi gün sistemin yine de yeniden kurulmak üzere olduğunu öğrendim.

Şanslıydım, ama birkaç şey öğrendim.

4
fredarin

Sunucu filosunun çoğu hala Windows NT olduğunda, kullanılan birincil uzak yöntem pcAnywhere idi. Biz "iyi bilinen" bir hata vardı, bazen sunucuları pcAnywhere kullanırken aniden yeniden başlatmak ve son kullanıcılara bu iyi bilinen hata söylendi.

Hata, pcAnywhere (en azından hangi sürümü kullanıyorduk) "Ana bilgisayardan bağlantıyı kes" düğmesinin yanındaki "Ana Bilgisayarı yeniden başlat" düğmesine sahip olmasıydı. Yani arada sırada ...: D

4
marty

VNC, 200 mil uzakta bir Win 2k Server'a girdi, bir IP adresi eklemeye gitti, bu yüzden ... sistem tepsisindeki ağ simgesine sağ tıklayın, 'Özellikler'i değil' Devre Dışı Bırak 'seçeneğini tıklayın - DOH! .... Çözüm .... Arabaya bin. Mutlu değil! Keşke o menü seçeneğinde bir 'emin misiniz' olsaydı!

Mikrofon

4
Mike McClelland

Yaz 2002.

Yanlışlıkla IE 6.0 günün ortasında 16.000 kullanıcıya zorla yeniden başlatma ile konuşlandırdım.

Aslında hatamı yakaladım ve en hızlı yazdım odadmin hepsini kapat (Tüm dağıtım sunucularını durdurmak için Tivoli komutu).

3
Shawn Anderson

Linux ve FreeBSD'de hostname -s will "Kısa Ana Bilgisayar adını görüntüler. Bu, ilk noktada kesilen Ana Bilgisayar adıdır".

Solaris 9'da, hostname -s, ana makine adını '-s' olarak ayarlar.

Bu nedenle, yöneticim Solaris 9 üzerinde çalışan 10 Mission Critical Oracle Database sunucusu da dahil olmak üzere 120 sistemimizin tümünü denetlemek için bir komut dosyası çalıştırdı.

for Host in `cat all-hosts`; do
ssh $Host "hostname -s"
done

Tüm Oracle sunucularımız anında başarısız oldu. Bu başarısızlığın hızı gerçekten şaşırtıcıydı, bu hatadan kurtulmamız yaklaşık 20 saniye sürdü, ama zaten çok geçti. Her şey çökmüştü.

İronik olan, veri merkezimizin sadece birkaç gün önce büyük bir elektrik kesintisinden muzdarip olması ve gelecekteki elektrik kesintilerinde daha hızlı iyileşme sağlamak için "güç kapatma/güç açma" e-tablonuzu güncelliyoruz.

3
Stefan Lasiewski

Ben değil, birlikte çalıştığım biri. AV sunucusunda işlem alanında * İçeren bir ilke oluşturdular. Layman'ın terimleriyle: * İsmini içeren herhangi bir işleme okuma, yazma, yürütme izni vermeyin.

Bu politika daha sonra 1.500 sunucuya çoğaltıldı ve bu da RDP'yi ve diğer işlemleri kapattı. Bunu düzeltmek, her sunucu sabit sürücüsünü tek tek monte etmek ve ilkeyi kaldırmak anlamına geliyordu. 15 kişilik bir ekiple 48 saat.

3
stuart Brand

Ben bir programcıyım, bu yüzden tüm hatalarım Stack Overflow'a ait. Ancak, tanık olduğum sistem yöneticisi hatalarından bazıları aşağıdadır.

  1. Windows NT etki alanındaki TÜM kullanıcıların oturum açma izinlerini iptal edin. (PDC'de yerleşik yönetici dışında, ne yazık ki sadece etki alanını kuran yüklenici şifreyi biliyordu ve uzun zaman önce kayboldu) Bunun nasıl yapıldığını bilmiyorum. Birkaç saat boyunca geliştiricilerimle oturup sohbet etmem gerektiğini biliyorum.

  2. Üye Sunucuları yanlışlıkla silin OU . Kasetten geri yükleme yapılırken birkaç saat daha sohbet edildi.

  3. Yöneticimiz tüm alan adı yöneticilerine CD ve disket sürücü erişimini kullanma izni vermeyi amaçlamıştır. (O zaman çıkarılabilir medyaya erişimi kontrol etmek için SecureNT kullandık.) Ne yazık ki grup üyeliğini geri aldı ve bunun yerine tüm çıkarılabilir medya kullanıcılarına tam etki alanı yöneticisi hakları verdi. Bunu bazı tablolar yapamamalıydı bir kullanıcı tarafından oluşturulan bir üretim SQL veritabanında geldi çünkü buldum. Söz konusu yöneticiye yüzünün değişimini izlemekten zevk aldığımı söylediğimde, hayır, doğru yol, aşağı, oh ****. Neyse ki ciddi bir zarar olmadı.

3
pipTheGeek

Ha, ilk gerçekten büyük kaza, geliştirme sunucumuza sadece dahili "Geliştirme" web sitesini güncellemek için kullanılacak olan tamamen güvensiz bir yazılım olan küçük bir SVN Yönetici paneli yazarken oldu.

Bazen SVN repo bozulur, bu yüzden istenen tüm SVN dizini temizler ve böyle bir şey baktı bir PHP dosya çağırır bir düğme yazmıştı ..

<?php
$directory=$_GET['dir'];
$result = Shell_exec("Sudo rm -Rvf /".$direcory);
echo $result;
?>

Bunu görmeyenler için - ben "Sudo rm -Rvf /" çalıştırmak için neden Shell_exec i "$ dizini" yanlış yazılmış .... İlk başta web sayfasının sadece zaman sildiğini düşündüm depodaki tüm dosyalar. Yaklaşık 10-15 dakika sonra ben 1/2 dosya sistemi üzerinde yok olmuştu keşfetti.

Hata.

2
grufftech

Eski işveren hikayesi harika. Bazı ayrıntılar masumları korumak için değiştirildi. Bir sorunlu çalışanım vardı, ona verimlilik dertleri çok fazla olan, ancak kendini kurtarmış ve bazı ayrıcalıklar kazanmış gibi görünen Fred diyorum. Tek sorun, ayrıcalıkları geri yüklendiğinde, sağlama komut dosyasındaki bir hata ona bazı ekstra ayrıcalıklar verdi.

Büyük bir projenin ortasındaydım, bu yüzden Fred'den bir uygulama için gerekli olan bir Windows düzeltmesini paketlemesini istedim. (Bu, insanların bugünkü kadar dini olarak yama yapmadığı patlama öncesi günlerde idi). Fred laboratuvarımızda bir test yapıyor ve her şey yolunda gidiyor.

Fred daha sonra birkaç soru sorar:

"Who should I Push it to?" (Mind you, this is a patch for some custom VB app)

"Everyone", I respond

"Ok, what time should it start?"

"How about 2AM?", I answer. (Figuring I'd have time to look over everything before I left for the day!)

Sonra ne olacak? Herkese Push etmek için yazılım dağıtım uygulamamızla bir iş kurar ve hatta ürünün desteklediği her platform için kutuları işaretlemek için bile naziktir. Daha sonra, 2AM için başlangıç ​​zamanını, yaklaşık 12 saat geçmiş olan 2AM'de olduğu gibi ayarlar.

Sonuç? Her şey yeniden başlatılır ve bazı VB5 çalışma zamanı düzeltme eki yüklemek için trys. Cuma günü öğleden sonra 2: 45 PM).

Her şey? 40.000 PC gibi mi? Evet. 3.000 Windows sunucusu? Evet. 300 HP, Sun ve IBM Unix kutusu? Evet. AS/400 kümesi? Evet.

Yeniden başlatmayan tek şey Windows DC'leriydi, çünkü AD adamları bir nedenden dolayı uygulamamızı devre dışı bıraktı. Kutsal kabus. Bir hafta sonra, hala çalıştığımı düşünemedim.

Yumruk hattı? Fred, artık hiçbir şeye zarar veremediği bir işe büyük bir tanıtım yaptı.

2
duffbeer703

Belki bir gece geç saatte beynin osurulması, her şeyden daha fazladır.

Geliştiricilerden biri bir Solaris kutusunda bir Java profil oluşturucu) çalıştırmakta sorun yaşıyordu. Profil oluşturucu, biri /lib 'Da ve biri /usr/lib Birkaç lds sonra her şeyi /lib 'Ya işaret ettiği için /usr/lib' Dan taşıdık ya da dediler.

Ama aniden hiçbir şey işe yaramadı. Hayır ls, hayır cd, _ cp veya mv yok. Yaklaşık 20 dakikalık 'oh crap, oh crap' 'dan sonra, geliştiricilerden birinin şu anda Emacs'ın şu anda çalışan bir kopyasına sahip olduğunu ve Libc'in yedeklenmiş /lib Kopyasını açabildiğimizi ve yazdığımızı anladık. orijinal adıyla geri döner. Ve işte! Her şey işe yaradı. Ders öğrenildi; Libc'yi olduğu yerde bırakın ve geliştirici isteklerinde saat 2'de değişiklik yapmayın!

2
beggs

Çok uzun zaman önce yoktu. Bazı Oracle ODBC köprü dağıtımı sırasında, yaklaşık 500 kullanıcı kaydındaki yolu değiştirmek zorunda kaldım.

Gerçekten oldukça basit bir işlem. Bu alıntıları unutmuşum çok kötü. İnsanlar garip karışık mesajlar (ODBC kurulum başarısız) sonra çınlamaya başladı ve makineyi yeniden başlatmanın sadece gerekli olacağını düşünüyor gibiydi.

Tabii ki, önceki bazı diğer kurulumlar sistem değişkeninde (boşluklar ve tümü, tırnak işaretleri olmadan) bazı program dosyaları yolunu HAZIRLADI (!!!), böylece yeni yol orada durdu, c:\Program'da (tabii ki, varoluş % ProgramFiles% öğesinin tamamen yoksayıldığı kaldı). Sistem yok, sistem32 yok, Shell yok. Yani oturum açma komut dosyaları da yok.

Yeniden başlatılan kişilerin artık ağ erişimi yoktu ve hiçbir otomatik komut dosyası hasarı onaramadı. Tabii ki, şikayetçi bir kullanıcıya gittim, etrafa baktım ve yolu kontrol ettim, anladım .. sinkin 'feel.

Yaklaşık 30 dakika içinde, herkese postalanmaya hazır en standart yol değerlerine sahip başka bir senaryom vardı (e-posta hala çalıştı). Kullanıcılar, yamanın gerçek olduğundan emin olmak için telefon ettiler, çünkü bunları uygulamak için garip nedenlerle şifreli exe göndermek için kullanılmadılar ve çoğu ne olduğunun farkında bile değildi.

İlk sürüm dağınıktı (her yürütmede yeni bir noktalı virgül), ancak mümkün olan her yol değerini günlüğe kaydetti, bu yüzden hızlı bir şekilde olası yollara sahip verilerim vardı, bu yüzden hepsini kontrol etmek için akıllı bir şey yaratmak zorunda kaldım, yolu güzelce bitirmek zorunda kaldım yerinde.

Sonuçta, sadece yaklaşık 45 dakika sürdü ve ben her şeyi geri koyan neyse ki bendim. Ama yine de, şimdi bozuk bir yol açıldığında, hala suçu almaya hazırım;)

2
Berzemus

En iyim, yedekleme sunucumuzun yönetimsel limbo olduğu bir zamanda geldi - patronum, ofiste, sunucu odamızdan site dışında kalması gerekip gerekmediği (ve herhangi bir nedenle yedekleme yapmaması) veya büyük miktarda bant genişliğinden tasarruf etmek için sunucu odasına kurulmalıdır. Hatırladığım kadarıyla bu limbo durum birkaç aydır var.

Web sunucumuz, web sitelerinin depolanması için bir RAID 5 dizisine sahipti. Üç sürücünün ikincisi başarısız olmadan bir süre önce bozulmuş modda (bilinmeyen nedenlerle beni bilgilendirmeden veya hatırlayamadığım) çalışıyor gibi görünüyor. Sunucuyu tekrar bir araya getirerek bir nighter çekmeliyim. Müşterilerimiz, web sitelerinin kaybolduğu için mutlu değildi ve kendi yedeklerinden geri yüklemeleri gerekiyordu. Özellikle kendi yedekleri olmayanlar.

Patronumun bana sorduğu sorular "Bir RAID dizisi nasıl böyle başarısız olabilir? Yapmaları gerekmiyordu!" ve "Neden web sunucumuzun yedeklerini almadık?"

Ancak, ders önemsenmemişti. Posta sunucumuza yapılan yükseltmelerin etkin yedekli bir RAID 1 dizisi içermesi gerektiğini önerdiğimde patronum kooperatifti (normalde yapacağı ekstra maliyet üzerinden benimle tartışmak yerine). Ve elbette, yedekleme sunucusu işini kısa sürede düzgün şekilde yapıyordu.

2
Ernie

Exchange Server 2007 "Posta Kutusunu Kaldır" ve "Posta Kutusunu Devre Dışı Bırak" özelliği arasındaki farkı öğrenmeye ne dersiniz? Özellikle bozuk bir veritabanıyla uğraşmak için herkesin eski posta kutusunu kaldırdığımda?

...

Bir değişim sunucusuna geri yükleme ... eğlenceli değil ... Bir değişim sunucusunu VE Active Directory'yi geri yüklemek zorunda ... eğlenceli değil.

Cuma sabahı saat 11: 00'de yapıyoruz.

2
IceMage

Sitenin RedHat 5 web sunucusunun birincil bölümünde biraz yer açmaya çalışıyordum. Linux için nispeten yeniydim ama DOS'u yıllardır kullanıyordum.

Tüm/bin klasörünü başka bir bölüme taşımayı, üretim web sitesini çıkarmayı ve erişilebilir sistem komutları olmadan kendimi bırakmayı başardım. Çıldırdım, yeniden adlandıramadım, kopyalayamıyordum, taşıyamıyordum, çünkü tüm bu yararlı yürütülebilir dosyaları taşıyabiliyordum.

Neyse ki bir önyükleme diski kullanabildim ve el işimi geri alabildim.

2
Darth Continent

RAID 5'te yeniydim ve hala nasıl çalıştığını öğreniyordum. O zamanlar çok küçük bir şirketteki tek IT adamıydım. Herkesin eriştiği tüm dosyalar yalnızca bir sunucuda saklandı. Sunucu alanı azalıyordu ve RAID dizisinde sadece 3 sürücü vardı, bu yüzden 4 ekleyerek alanı ve duyarlılığı artıracağını düşündüm. Bunu mesai saatleri içinde yaptım. Mesai sonrası bakım kavramını öğrenmemiştim.

Dizi yeniden oluşturulmaya başladı ve 36 saat içinde yapılacağını söyledi. Bunun çok uzun olduğunu düşündüm. Yeniden oluşturma önceliğini kontrol eden bir kaydırıcı buldum ve en düşük ayara ayarlandı. Orta olarak ayarladım. Zaman 8 saate indi. Sabit sürücü ışıkları biraz daha hızlı yanıp sönüyordu, ancak bunun hala sadece 80GB veri için çok uzun olduğunu düşündüm. Bu yüzden önceliği yüksek olarak ayarladım. Sabit sürücü ışıkları sağlamlaştı ve "bu daha çok böyle!" Diye düşündüm. Sonra kullandığım GUI yanıt vermiyor. Uzaktan kutuya bağlandı. Onu geri getirmeye çalıştım, ancak sunucuyu bulamadı.

Koridordan aşağı sunucuya alamadım şikayet insanlar duymaya başladı. Neler olup bittiğini görmek için giriş yapmak için sunucuya gittim. Boş ekranın arka plana değişmesi 5 dakika sürdü. Giriş İstemi gelmeden 5 dakika daha geçti. Her tuşa basmak 5 dakika sürdü. Önceliği o kadar yüksek ayarlamıştım ki, sunucu hiçbir şeye cevap vermeyecekti. Dizinin yeniden oluşturulması 2 saat sürdü. Neyse ki öğle yemeğinden bir saat önce, bu yüzden kimse gerçekten bu kadar umursamadı. O zaman benim müdür gerçekten harika bir kadındı ve büyük bir anlaşma olmadığını söyledi. Baş tasarım mühendisi bana ortalama bir görünüm verdi. 2 saat boyunca mermi terletiyordum. Ders öğrenildi.

2
Joseph

Ben bir çalışan onun laptop yavaş şikayet vardı, bu yüzden sabit disk parçalanması kontrol ve (şimdiye kadar gördüğüm) kötü oldu (ve bu güne). Sürücüyü birleştirme girişimleri sonuçsuzdu çünkü yeterli boş alan yoktu. Geçici dosyaları temizlemeyi denedim (neden sadece geçici olarak sunucuya bir şey taşımadığımdan emin değilim) ve aptalca tüm Outlook.pst dosyasını gerçek e-postasının değil, e-postasının bir yedeği olduğunu düşünerek sildim. Beni affetti, ama asla unutmama izin verme.

(Bu, üniversiteyi bitirdikten kısa bir süre sonra yıllar önce oldu. Şimdi çok daha yetkinim.)

2
Scott

Çok aptalca bir hata. Linux iş istasyonumda bir dizi dosyayı işleyen bir senaryo yazıyordum, ancak çok fazla dosya olduğu sürece ne tür dosyalar olduğu önemli değildi. Bu yüzden, testlerimi yaptığım bir dizine /etc Kopyalamanın iyi bir fikir olduğuna karar verdim. İşler ters gittiğinde, kopyayı sildim ve /etc Dosyasını tekrar test dizinime kopyaladım. Bu iyi gitti, bir süre için ve sonra

rm -rf /etc 

onun yerine

rm -rf etc/  

Tamam, endişelenecek bir şey yok, hala iş istasyonumda bir şeyler yapabilirim ve başka bir iş istasyonundan ya da başka bir şeyden kopyalayarak canlandırabileceğimi düşündüm. Veya günün sonunda yeniden yükleyin. İlk olarak, içecek bir şeyler alın ve şirket politikası nedeniyle ekranımı kilitledim. Lanet olsun, kilidini açmak için şifreme ihtiyacım var ve bu/etc/.....

Aptalca hatalar:

  • çok fazla kök yapıyor (bunun için iyi bir nedenim vardı O :)).
  • /etc yerine etc/ yazmak
  • test amacıyla /etc
2
blauwblaatje

Unix kutusunda "bin" kullanıcısını yanlışlıkla sildim. Elbette, bir kullanıcının silinmesi ana dizininin de kaldırılmasına neden olur.

Bin'in ana dizininin ne olduğunu tahmin edebilir misiniz?

/çöp Kutusu

1
Barry Brown

Birkaç şirket önce her şeyi çalıştıran ana sunucu olarak bir Windows NT 4 kutusu vardı, bir yedek olarak aynalı bir sabit sürücüye sahipti.

Yanlışlıkla birkaç önemli dosyayı sildim, sorun yok sadece kutuyu yeniden başlatın, SCSI menüsünden disk 2'yi seçin ve bir dakikadan kısa sürede kopyalamaya geri dönüyoruz.

Sonra ayna sürücüsünü yeniden oluşturma komutunu başlattım. Windows'un artık yeni C: ve D: sürücülerine sahip olmasına rağmen, akıllı yansıtma yazılımının buna kandırılmayacağı ortaya çıktı. Kaynak ve hedef için SCSI kimlik numaralarını kullandı ve 1-> 2 mutlu bir şekilde kopyalandı.

Teşekkürler Adaptec!

1
Martin Beckett

Hafta sonu, neredeyse bina dışından herkes, hafta sonu boyunca tam yedekleme için, otomatik değiştiriciye yeni bantlar yüklemek için sunucu odasına gidiyorum. Ac çok soğuk bence ve kapatmak (sunucu odası sadece duvara monte ac - ciddi bir şey için para ile bir oda oldu). Bu yüzden bantları yüklüyorum, TBU'nun barkodları okuduğundan emin olun ve dışarı çıkın.

Ertesi gün, sabahları bir akşamdan kalma (hey, haftasonu!) İle uyanıyorum, telefonuma bakıp SMS mesajlar “$ server iniyor”). bir diğeri "ana UPS iniyor".

Anahtarları alıyorum, ofislere gidiyorum ve sunucu odasını açıyorum, orada 60c civarında olduğunu ve tüm ekipmanların kapalı olduğunu bulmak için.

UPS ve 40+ sunucu ve iletişim ekipmanından bahsetmiyorum bile, AC çalışmaya başlamadan önce sıcak havayı dışarı çıkarmak için birkaç fan sürükleyerek sona erdi. Ve hafta sonunu elbette ofiste geçiriyoruz. Ve ortam sıcaklığı çok yüksekse akıllı UPS üniteleri için tüm tanrılara teşekkür eder. O zamandan beri her zaman kapüşonlu tutuyorum ve AC'yi asla kapatmıyorum

1
dyasny

On, artı yıllar önce SOCKS vekili gerektiren bir proje üzerinde çalışıyordum. SOCKS proxy'ye ek olarak, NAT, DHCP ve diğer birkaç güzel ile güzel bir küçük Internet ağ geçidi işlevi sağlayan WinGate adlı bir program kullanıyordum. Bu, Windows İnternet Bağlantısı paylaşımına sahip olmadan önceydi, bu nedenle WinGate, çevirmeli modeminizi Ethernet ağınızla paylaşmanıza izin verir.

Yazılımı yükledim ve SOCKS istemci işlevselliği üzerinde çalışmaya başladım. O günün ilerleyen saatlerinde internet bağlantısını kaybettik. Aniden durdu ve şirket dışından kimse erişemedi. İSS'mizi aradık ve bağlantıda her şey iyi görünüyordu. Yönlendirici iyi çalışıyordu. Neyin yanlış gittiğini anlayamadık. TCP/IP hakkında biraz bilgim olduğu için bir noktada konuşmaya başladım, ancak ilerleme kaydetmedim.

Ertesi gün BT görevlisi DHCP sunucusunun yönlendiricinin adresini birisinin makinesine verdiğini ve herkesin hiçbir yere gitmeyen varsayılan ağ geçidi için kullandığını anladı. O günün ilerleyen saatlerinde BT görevlisi ofisime geldi ve "Yanlış IP adresini kimin verdiğini anladınız mı?" Diye sordum. "Evet, sensin!" Dedi.

WinGate varsayılan olarak bir DHCP sunucusu çalıştırmıştı ve önceki adresi süresi dolan ilk istemciye yönlendirici adresini vermişti. Bir süre oldukça kırmızı yüzlüydüm.

1
David Smith

Gençken, 'yardımcı' olmaya çalışıyordum ve 128 kbit/s'lik bir hat üzerinden 250 MB veriyi aynı anda 86 farklı siteye kopyalamaya çalışıyordum ... çalışma saatleri içinde). Bunu yaparken, insanların neden her şeyin bu kadar uzun sürdüğünü sorduğunu duydum.

Söylemeye gerek yok, transferleri öldürdüm ve (neyse ki) kimse benim olduğumu bilmiyordu!

1
JFV

Unix kutularında müşteriler için anahtar teslim IVR sistemleri kurduk. Bir keresinde geliştiricilerin tüm kodları/devel'de bulunuyordu. Benden geliştirme dizinleri ve kutu kaldırmak ve bir Pazar öğleden sonra (gün izin!) Sunucuları havaalanına almak istedi. Acelemde/dev/* sildim. Anında hatamı gördüm, oturdu ve bir dakika düşündüm. Çekirdeğin sistem aygıtlarına herhangi bir kancası olmasaydı, sistemin ölüp ölmeyeceğinden emin değilim, bu yüzden aynı makinede/dev dizinine baktım ve sırayla klavye, tty, scsi sürücülerini geri yüklemek için mknod [c | b] major minör, fd0 ve null daha sonra diğer makineye/geliştiriciye bir disket yaptı ve gerisini almak için yerel olarak monte etti ve kopyaladı.

Yine de bir şeyleri yalnız bıraksaydım ne olacağı hakkında hiçbir fikrim yok, ama yeniden başlatmada mutsuz olacağından eminim :)

Alınan ders - geliştirme dizini/devel olarak adlandırılamaz.

1
schemathings

Bu, ilk destek işime üniversiteden yeni başladığımda oldu, bağlantı sorunları hakkında şikayet ettikten sonra kullanıcının makinelerinden birine geçmeye çalışan bir müşterinin 2003 sunucusuna bağlandım.

Bazı temel sorun giderme işlemleri ile konuştu ve statik IP'si olduğunu fark etti, bu yüzden DHCP'ye ayarlayarak konuşmaya başladı. Ne yapacağımı onunla konuşurken sunucu üzerindeki LAN bağlantısındaki özellikleri açtım. Onu yeniden DHCP'ye ayarlamaya çalıştıktan sonra hala statik bir IP'si vardı, bu yüzden ondan bağlantıyı devre dışı bırakmasını ve yeniden etkinleştirmesini istedi.

Şimdi bu noktaya kadar, herhangi bir ayar değiştirmeden sunucuya anlattığım her şeyi yapıyordum, hemen LAN bağlantısına sağ tıklamasını ve ardından devre dışı bırakmayı seçtiğim noktaya kadar.

Az önce ne yaptığımı fark etmem için belki yarım saniye aldı.

Diğer mühendislerin, müşterilerin sitesinde NIC ürününü yeniden etkinleştirmek için bir saat sürmek zorunda kalmadan önce bana gülmeyi bırakması belki 10 dakika sürdü.

1
Darren Mac

Her biri iyi tanımlanmış bir geliştirme ve test döngüsüne sahip bir grup veritabanı sunucusuna bakıyordum. Bizim rolümüz, geliştiricilerin sağladıkları değişiklikleri, belgelerini test ortamlarından kullanarak, canlı yayına geçmeden önce müşteri testi için müşterinin test ortamına dönüştürmekti. Bunun bir parçası olarak, müşteri test ortamı canlı ortamın en son yedeklemesinden oluşturulmuştur.

Tüm bunlar, müşterinin değişikliği imzaladıktan sonra değişikliği canlı ortama aktarma süreci ile birlikte düzgün bir şekilde belgelenmiştir.

Ekibimizde yeni bir başlangıç ​​yaptık ve birkaç ay bizimle birlikte olduktan sonra, bir kader geceye kadar onu yapmasına izin verene kadar bir dizi değişim döngüsünde oturmasına izin verdik. Müşteri testleri sorunsuz geçti ve müşteri memnuniyetle değişikliğe gitti.

Daha sonra yeni başlangıç, değişikliği test ortamına her kattığında yaptığı şeyi yaptı, geri kalanımızın yaptığı belgeleri izlemesi gerekmediğinden emin. Adım (1), önceki yedeklemeden yeniden oluşturma ...

Ertesi sabah müşteri bir önceki günün işinin eksik olduğunu fark etti ve ne olduğunu öğrenmek uzun sürmedi. Neyse ki veritabanlarında değişiklik kaydı etkinleştirilmiş olduğundan tüm etkinliği kurtarabildik. Yeni başlangıç ​​en azından belgelere değer vermeyi ve gelecekte izlemeyi öğrendi.

1
Cry Havok

Geçen hafta başıma iyi bir yenisi geldi.

Yaptığımız bir test platformu için adamlarımızdan birinin geçici bir DNS sunucusu oluşturmasını istedim, DNS adamlarımızdan bu yeni geçici DNS sunucusuna işaret etmek için belirli bir test alanını güncellemelerini istedim, ancak adam test kaydını değil canlı kaydı güncelledi .

Aniden bu bir sunucu (neyse ki yeni bir kutu çok makul bir özellik) yaklaşık 5 milyon kullanıcı için hemen hemen her DNS isteğine hizmet ediyor - ilk gün 400 milyon istek! - Neyse ki TTL sadece 24 saatti, bu yüzden şimdi çoğunlukla boşaltıldı.

1
Chopper3

Tamamen farklı boyut, ancak yine de bir sistem yöneticisi kazası.

Üzgünüm: Bunu elde etmek için bazı İtalyan argo anlamanız gerekir. Çevrilemez. Bunu ezbere bilmelisin

Napoli, İtalya'daki bir Solaris sunucusunda bir şey düzeltmem istendi. Kök parolaya ihtiyacım vardı ve o zaman çok fazla İtalyanca bilmiyordum. Çocuklar bana bunun ne olduğunu anlatmakta isteksiz görünüyorlardı. Sonunda bunlardan biri yarı fısıldadı:

sticazzi

Dedim ki: Aha, 'sticazzi'. Bunu nasıl hecelersin? ve ona bir parça kağıt + kalem verdi.

Bir yıl sonra M.*o B.* tekrar (Merhaba! - bunu okuduysanız). O zaman İtalyancam çok daha iyiydi. Ona şimdi biraz daha italyanca bildiğimi söyledim.

Bu zor bir kahkahaydı.

Hikayenin ahlaki: Bilmediğiniz bir dilde kök parola istemeniz gerekiyorsa, size daha iyi gülün, kızarın ve aynı anda hakarete bakın.

1
fredarin

Herkes bir yerde yanlışlıkla rm -rf/'dir. Mine, son veri yapıları atamamın sona ermesinden 2 gün önce ana dizinimdeki bazı ekstra dosyaları silmeye çalışıyordu.

Profesyonel olarak şimdiye kadar herhangi bir felaket vida yukarı sahip olmayacak kadar yetenekli.

1
sclarson

Bu benim başıma gelmedi, ama sanırım gerçekten güzel bir hikaye.

Bu adamlar, bildiğim gibi, bu şirketin sahip olduğu birkaç Informix veritabanı için veritabanları tutan eski Solaris tam kule sunucularından biriyle çalışıyorlardı. Bu temel bir yardımcı şirketti, bu yüzden ne kadar veri olduğunu hayal edebiliyorsunuz.

Sunucular aracılığıyla çeşitli yapılandırmaların bir diskete kopyalanıp sunucudan sunucuya aktarıldığı bir nokta vardı. Bir sunucu ile çalıştıktan sonra, sadece disketi çıkarır ve bir sonrakine geçer.

Sysadmin grubundaki başka bir kişi eşliğinde, bu adam rastgele yapılandırmalardan bahsederken bu konfigürasyonlar üzerinde çalışıyordu. Adımını bitirdi, böylece disketi çıkartmak için düğmeye bastı.

- "BEKLE! Düğmeyi bırakma!"

Tekrar baktığında, çıkarma düğmesine değil, hata durumunda sıfırlama düğmesine basmıştı. Bu düğmeyi bıraktığı anda, şirketin tüm veritabanı sistemi derhal kapanacaktır. (Bu düğmelerin anlık olduğunu düşündüm ... ama hikaye böyle gidiyor.)

Böylece, her sistem yöneticisi departman yöneticilerini aramak ve "herkese sistemden çıkış yapmasını söyle. Şimdi." Bu adam bir sunucuya parmağınızla bağlı olan herşeye benziyor.

1
Alpha

/etc/network/interfaces Debian kutusunda, birisi yanlışlıkla IP adresi satırındaki ve ağ geçidi satırındaki IP adreslerini değiştirdi.

Çekirdek anahtarın IP'sini "çaldığınızda" ne olacağını tahmin edin?

1
prestomation

Oh, bir gün yanlışlıkla bir PostgreSQL veritabanı sildim ve günlük dosyalarından kurtardım;)

0
maciek

Neyse ki sizinle paylaşmak üzere olduğum şeyden kolayca kurtulabildim. Yani rezilleri duydun

rm -rf /
deltree/y/s/b \

Benim sorunum bunu yazdım ve yanlış olduğunu biliyordu, bu yüzden geri tuşuna basmaya gitti, ama yağ parmaklı ve yerine enter tuşuna basın! Yaptığım şeyi anlamam sadece 2 saniye sürdü, bu yüzden işlemi iptal etmek için ctrl-c'ye art arda basmaya başladım. Durduğumda, dosya sisteminin yarısı gitmişti.

Kurtarmaya yedekler dostlarım! Yeniden başlatma dışında başka kesinti süresi yoktu. Bir zamanlar, o gün gerçekten şanslıydım çünkü yerinde büyük yedeklerim vardı.

0
jftuga

Sistem yönetiminin ilk zamanlarında perakende mağazalarımız için envanter işlemi (stok alma) yapmak için yeni bir yöntem keşfettim. Onlara çok sayıda dizüstü bilgisayar aldım ve barkod tarayıcıları bağladım ve tüm makaleleri pappier'e kalemle yazarak yaptığımız gibi normalden on kat daha hızlı yaptım. Ayrıca bazı Symbol PDT DOS el terminalleri satın aldım. Symbol terminallerinin bataryalarının ömrünü uzatmak için kendi batarya paketlerimi ve kabloları manuel olarak bağladım. O gece ve ertesi sabah kendimle gurur duydum ve ofiste dolaşırken ne kadar akıllı olduğumu söyleyen bir tavus kuşu ile gurur duydum.

Kabus, hisse senedi ve listelerin hesaplanması ve karşılaştırılması için sunucuya veri gönderirken başladı. Fazladan bir pil takımına sahip Symbol cihazlarından biri yanıp sönmüştü çünkü kablolardan biri atlamış ve cihaz uzun süre enerjisiz kalmıştır.

Şimdi yaklaşık 100 işverenin işi suya düştü. 13 veya 15 cihazın amacı ve hepsine sahip olmasaydım bunların listesi nedir? Envanterin eksik olduğunu nasıl bilebilirim?.

Felaketimi daha yakından tanımlamak için, yılda sadece birkaç gün izin aldık. Mağazalarımızı kapatıp stok alma yaptığımız zamandır ve bu olay şirketimize çok para ve çaba sarf eder.

Benim için şanslıyız, bu yeniden deneme müdürümüz ve şefimiz o yıl bilgisayardaymış gibi envanter listelerini kabul etti.

Bundan sonra, çalışma devam ederken ve envanter sürecini bitirdikten hemen sonra her zaman iki veri kopyası yapıyorum ve artık övünmüyorum.

0
adopilot

Bu çok kötü değildi bu yüzden sunucumda barındırılan sadece 30-40 siteleri ile acemi/hobbiest sysadmin biraz değilim./Bin/xxx dizinindeki tüm dosyalarda yürütme izinlerini kaldırıyordum ve hepsi ile başladı.

Açık bir eylemde bulunarak koştum

chmod -R a-x .*

Vay. bin dizininizdeki yürütme izinlerini kaldırdığınızda, temizlenmesi oldukça zordur. Veri merkezi teknolojileri, düzeltmek için canlı bir CD'ye önyükleme yapmak zorunda kaldı. En iyi bölüm, nasıl düzeltebileceğim onları yürümek zorunda kaldı. En kötü yanı, hala bana gülecek kadar iyi biliyorlardı: P

0
Brandon Wamboldt

İnternetin ilk günlerinde her şeyi SGI Challenge S sunucularında çalıştırdım. Bir noktada, bilgim dışında, "sanat departmanı" IKON'dan bir demo oluşturma baskı sunucusu sipariş etti. Bir sabah yürüdü, komik oyunculuk meydan, yönetici sunucu odasına çağırır, biz rutin teşhis geçmesi, vb nihayet ben güç kaynağı OLMALIDIR diyorum. Tabii ki yedekimiz yok. Ana ofise geri dönüyorum - ödünç veren makineye bakın ve farkına varın - aynı zamanda bir SGI - açın, güç kaynağını sökün, sunucuyu yeniden başlatın - bingo! Bir gecede yedek bir sipariş veriyoruz, temsilcimiz demoyu nasıl sevdiğimizi sormak için AM'de ortaya çıkıyor, FedEx'in ortaya çıkması için 30 dakika boyunca hummada hummada'ya ihtiyacımız var ve güç kaynaklarını yeniden değiştirip demo kutusunu kapıdan yuvarlıyoruz. Hepsi bir gün içinde çalışır.

0
schemathings

Uzun zaman önce veri bölümümün bağlama noktasını değiştirmeye karar verdim. Bu yüzden yeni bir dizin oluşturdum,/etc/fstab içindeki bağlama noktasını değiştirdim ve önceden bağlandığı dizini sildim.

Mesele şu ki, nautilus bana bir ilerleme çubuğu gösterdiğinde (4Kb silinmesi için) bölümlerin hala eski dizine monte edildiğini fark ettim. Neyse ki büyük bir hasar yapılmadan önce iptal edebildim, ancak bazı dosyaları kaybettim.

0
Flávio Amieiro

Bir ortak konumdaki bakım sırasında birincil DNS güç kablosunu aldım. O zaman ikincil değiştiriyordum ve rafı kapatmadan önce kabloyu çekmiş olmalıydım. Tüm sitelerimiz hızlı bir şekilde düşmeye başladı ve aptal şeyi tekrar takmak için ortak yere geri dönmek zorunda kaldım.

0
Snipper

İlk kurulum görevimde (yıllar önce DOS çağında) yanlışlıkla kamu kurumu müdürüne ait bilgisayardaki neredeyse tüm sistem dosyalarını ve yarım uygulama dosyalarını silerim. Ama bu benim hatam değildi. Biraz yer açmak için C:/TEMP klasöründeki önemli olmayan dosyaları silmeye çalışıyorum. Silme başlar ... birkaç dakika sonra kök ve DOS klasöründe bazı tanıdık isimler görüyorum ... Sabit Ctrl + Break vurmak ... ama çok geç ...

FAT dosya sistemindeki çapraz bağlantılı dosyalar sorununun ne olduğunu öğrenmenin zor yolu buydu.

0
miHost

Kuzey Minnesota'daki mühendislerimiz için bir soğuk test tesisimiz var. Yaklaşık 10 yıl önce oradaki T1 öldü. Çünkü biz hemen hemen her şey işe yaramaz bu yüzden daha hızlı hattı kurmuştu çünkü biz sunucuları bu tesis bizim ana veri merkezi aşağı taşınmıştı. Minnesota'nın merkezindeki bazı çiftçilerin bir parça çiftlik ekipmanı ile liflerden geçtiğini öğrenmeye gelin. Lifin o ekipman parçası için bile erişilebilir olduğu ve çok daha derine gömülmediği için çok mutlu değildik ...

0
squillman

Bir fincan kahve hayal edin. Şekerle dolu bir bardak. Bir rafın geri çekilebilir klavye tepsisinde yanlış yerleştirildiğini hayal edin. Sunucularla dolu bir raf. Tepsi bir şekilde rafın içine itilir. Bardak rafa girer ve sonra devrilir.

Bu benim hatamdı ve o zamana kadar deneyimli bir yöneticiydim, bu yüzden mazeretim yok. Yakın bir banyo vardı ve kağıt havlu ile karışıklık çoğu paspas başardı. Neyse ki yeterli kahve sunucuların içinde var, bu yüzden onları kapatın ve iyi temizlenmiş. Sadece 400 kullanıcı etkilendi. Uf!

Sonra başka bir kaza oldu, diyelim ki, bir arkadaşımın başına geldi. Son 10 yılını kendi şirketini kurmaya adamıştır. ~ 15 çalışanı var ve şirketin tüm verileri bu tek sunucudaydı. Bu, geçmiş ve şimdiki tüm projeleri, çok sayıda müşteri verisini, güvende tutmak için sözleşme yaptığı bilgileri, tüm iletişim bilgilerini vb. İçeriyordu. Tümü LUKS ile güzelce şifrelenmiştir. Yedeklemeye başlaması için uzun zamandır onu rahatsız ediyordum, ama asla yapmadı. Çok meşgul, para sıkıntısı çekiyorsunuz. RAID1'inin onu kurtaracağından emindi. Son yedeği 8 aylıktı. Bu onun sunucu çalışma süresi de oldu. LUKS şifresini son yeniden başlatmadan hemen önce, bundan 8 ay önce değiştirmişti. Şimdi sunucusunu yeniden başlattı ve daha sonra yeni şifreyi yazmadığını fark etti ve hatırlamadı. Hatırlayabildiği tek şey, çok uzun olduğu ve bir şekilde büyük harf ve muhtemelen atılan sembollerle yaklaşık bir şekilde düzenlenmiş birkaç kelimesi olmasıydı.

Çalışanlar arasındaki demoralizasyon derecesini ve bilgilerini işlenmek üzere yeniden göndermek zorunda kalan müşteri öfkesini hayal edebilirsiniz, böylece verilerini öğrenmek "geçici olarak" kullanılamaz. Uzun bir hikaye kısaltmak için yaklaşık 40 saat çalışmam, 14 günlük çalışma sürem ve sonunda bir LUKS şifresini bulmak için bir milyondan fazla şifre oluşturmak ve test etmek için özel bir program aldı.

0
joechip

Birkaç yıl önce, o zaman iSeries yöneticimiz, IBM iSeries sunucularımızın bilgisayar odasında oturduğu alanda bir miktar temizlik yapıyordu. Bu sabah 8:30 civarındaydı. Tıpkı o zaman üzerinde çalıştığım her şeye devam etmeye başladığım gibi. Birkaç saniye sonra ekran karartı, telefon görüşmeleri başladı.

Bir masayı hareket ettirdiğinde, güç kablosunun masayı hareket ettirdiğinde ortaya çıkacak kadar bacağın etrafına sarıldığını öğrenin.

Yaklaşık iki saat sonra sistemin gücü kesildikten sonra insanlar tekrar çalışabildi.

0
Mike Wills

Birkaç yıl önce biraz karışıklık vardı. Sabahın ortasında, kullanıcılar SQL Server tarafından barındırılan uygulamamıza erişirken kilitleme ile ilgili birçok hata bildirmeye başladı. Uygulama tamamen durma noktasına geliyor - kimse bir şey yapamaz. Neyin neden olduğunu bulmak için zaman ayırmak yerine, acil bir yeniden başlatma yapıyoruz ve her şey tekrar çalışmaya başlıyor. Sonra neyin tetiklediğini görmek için çeşitli günlükleri buruşturmaya başladım ve her şey göbeklenmeden hemen önce karşılık gelen bir KOMİT olmadan ana tabloya karşı açık adlı bir işlem buluyorum.

İş arkadaşımın, ana tablodaki bazı hatalı verileri düzeltmek için Query Analyzer'da bazı SQL yazdığı ve bunu bir işlemin içine yerleştirdiği ortaya çıktı. Ancak, sadece F5'i çalıştırmak için vurmak yerine, her şeyi vurguladı ve sonra F5'e çarptı. oldukça her şeyi vurgulamamış olması dışında ... işlemi gerçekten KESİNLEDİĞİ sonunu kaçırmıştı ... masayı kilitli bırakarak.

0
MartW