PDA

View Full Version : Ressurection на геройски загинала дънна платка?



minus273dot15
01-27-2011, 19:56
Вероятността да получа смислен отговор тук се движи в порядъка между нула и никаква, но все някъде трябва да си излея мъката на чист български език, след като го направих няколко пъти на английски, няколко пъти на руски и един на немски(е те тва последното ми спря тока...още не мога да спра да се дзверя).

Значи, имаме си една прекрасна системка. Такава, джиджана, лъскавка:

Дънна: A6VMX, no modifications, rev 00
Процесор: Athlon X2 5200+, running stock
Памет: 2х1GB PQI DDR2/800, running stock
Дискове: 2х160GB WD160AAJS, running in RAID 0
Захранване: Fortron/450Watt

Нали, нищо претенциозно - конфигурация на малко над 2 години, която работи постоянно(ако не е свалена за профилактика). А, да - преди 5-6 месеца я преместих чисто физически три километра на север, което значи още 2-3 часа че не е работила. Вероятно й се събират няколко дни да е била изключена. :neutral:

Нещото врътка Slackware с основна задача рутиране и разпределяне на мрежов трафик - нищо кой знае колко сложно. Работеше без проблеми до преди седмица. Всмисъл - проблеми е имало, но не такива които са налагали да се спира мапината за да бъдат отстранени или ако се наложи да се спре - за не повече от няколко минути, докато отново е на линия.

Седиш си, цъкаш си някаква глупост и изведнъж откриваш, че просто тоя компютър липсва от мрежата. Ей така, от нищото. Нали, кратка разходка до него, поглеждаш го - свети като коледна елха, сякаш прави нещо, всички лампички мигат бясно(Power, HDD, DVD, Lan, etc). Екрана черен. Не отвечает. Power off. Power on. Започва да зарежда - kernel panic, not syncing, auto restarting... Ехееее, сега си набихме филма. И се рестартира, и се рестартира, и се рестартира...

Хав но фиър, батко ви ис хиър. След пауза за кафе, се откриват 14 лоши сектори в RAID масива. Няма дертове, всичките на първият диск. Бекъп, преминава се в RAID 1(mirror), разпъни бекъпа, да мерси, сега зареждаш, браво, тестове, местове, перфектно.

Три дни. И пак изчезна в нищото. Отивам пак на място, пак същата дискотека от светлинки. И първият и вторият диск не зарежда нито в RAID, нито по отделно. И по двата грешки. Хм, баси интересното. Я да ги закачим на друг компютър, да видим как са - бачкат си перфектно. Я да закачим чисто нов диск за джиджаният компютър... откриват му се грешки?!? WTF?!? Хайде едно бързо оплакване към производителя на чипсета и дънната платка.

Съветват ме да ъпдейтна BIOS, което категорично щяло да ми разреши проблемите, защото съм с версия 1-ва, а вече имало 19-ти ъпдейт. Ами добре, нека да ъпдейтнем, да видим...

Зареждам си DOS от флашка, пускам ъпдейта на BIOS-а, който ми е посочил производителя и съм си дръпнал от сайта на производителя и е за точно този модел дънна платка. Изтриване на BIOS, Записване на новия BIOS, Проверка на записа... Мда, всичко наред. И ме пита дали да се рестартира. Ами защо пък да не се рестартираш? Давай. Перегрузка.

Екрана стана черен... и си остана черен. Няма бип. Няма мип. Гробна тишина. Първата ми реакция - да напсувам съпорта на руски. Не ме разбраха. После кротко обясних на английски, какво се е случило. Казаха че е невъзможно и аз съм бил объркал нещо. Напсувах ги на български, щото ми е по-лесно така. Настоявах, че нищо не съм объркал. Не ми повярваха. Казаха ми да се обърна към специалист или специализиран сервиз. Казах им че аз съм специалист, който работи в специализиран сервиз. Казаха ми че си измислям и прекратиха връзката. :shock: Добре. Майната им на тях, те са мальоумни. И без това повтарят заучени глупости като роботи.

Намирам много внимателно процедурата за възстановяване на BIOS, ако бъде флашнат погрешно. Още по-внимателно намирам флопи(в какви останки се рових само, ама айде да не се оплаквам), кабел за флопи(побърках се, ей! такива артефакти трудно се намират!), и дискета. Процедурата е проста - записваш BIOS-а като AMIBOOT.ROM на дискета(FAT32), хакаш флопито на компютъра, ресетваш BIOS-a, включваш компютъра и той БИ ТРЯБВАЛО да започне да чете дискетата и да си флашне сам BIOS-а с този, от дискетата, когато открие че наличният му не работи.

Пеноооо, пенооо... дръжки. Не чете флопито. Не чете CD/DVD. Не чете и USB. Седи, врътка си вентилаторите и екрана стои черен. Ни звук, ни стон. Окей, нали, аз съм упорито копеле, не се давам лесно. Викам си - сега ще е някакво адско съвпадение и нещо може да е изгоряло, а причината на да не е в BIOS-a. Започвам поетапно да сменям.

Подменям захранването, с ново. Йок.
Добавям видеокарта(HD2600). Йок.
Подменям RAM-a с 1х512MB/DDR2. Йок. На различни слотове. Пак йок.
Сменям процесора с Athlon X2 6000. Назад, назад моме Калино. Нула реакция.

За всеки случай, тест на свалените компоненти преди да ги върна - всичко работи идеално на други компютри, освен дънната, разбира се.

Айде пак при съпорта. Този път някаква мацка. Викам й - мацко, не ща да си говоря с теб, щото ще се изнервя, а не искам да се карам с жени, да им наранявам крехката психика, дай - намери ми някой твой колега да си поговоря с него. Бил съм я дискриминирал :shock: Тя била жена, ама можела да ми отговори. Хубаво, тиквичке. Ела сега, говори ми. Казах й за какво става дума. Трябвало да ида да се консултирам със специалист или в специализиран сервиз. ](*,) Опитах се много спокойно да я информирам какво съм и така нататък. Разгеле, от третия път ме разбра. Не я псувах(горд съм със постижението).

Тогава мацката ми предложи, да им изпратя дънанта платка, да я оправели те, някъде си в Германия. Шшшш. Ало. Питах я колко ще струва според нея. Не можела да каже. Викам, мацко, сега аз ще ти кажа. 10 евра е едната посока куриерски услуги, 10 евра в другата посока, и вие да вземете 10 евра за поправката(хаха, да бе) - 30 евра, което е 60 лева. Линкнах й как за 60 лева мога да си купя чисто нова, че и по-добра дънна платка, с две години гаранция и я питах как си ги представя тия неща. Тя нещо ми се разсърди и се наложи да я успокоявам и да си говорим за еднорози, дъгички и зелени тучни ливадки(ужас, ужас). След това изяснихме, че не става дума за парите, а става дума, че съм действал под указанията на съпорта на Foxconn, което е довело до пълното нефункциониране на дънната платка.

Айде още обвинения че съм бил некомпетентен, аз пък им върнах, че са смотана компания с нулев съпорт и ако искат да станат по-добри да вземат пример от Asus. Тука вече еднорози и ливадки не помогнаха.

Такаааам. По всичко личи, че просто ще се купи нова дънна платка, но изникват няколко интересни въпроса:
1) Защо след като ъпдейта мина ОК има проблем?
2) Защо след като има проблем, не може да се ползва процедурата за аварийно флашване на BIOS?
3) Какъв е изхода от ситуацията, който привежда дънната платка обратно в работно състояние и цената му е под тази на друга такава(имайте предвид, че дъно AM2 на 2+ години, без гаранция = 20-25 лева по нашите географски ширини).

ПП. И да не забравя - не си купувайте Foxconn и AMD никога. Ни-ко-га! Не ме гледайте, че съм го взел този - тогава ми трябваше компютър тип "какъвто и да е, за малко", а познати бяха на зор за пари(някакви здравословни проблеми) и искаха да го разкарат, та им направих услуга да го купя.

Cybershot
01-27-2011, 20:14
Южния мост май ти е сдал багажа (или повечето контролери в него)
Предполагам си огледал кондензаторите, но аномалиите са твърде много и май всичките сочат южния мост....

minus273dot15
01-28-2011, 04:45
Южния мост май ти е сдал багажа (или повечето контролери в него)
Предполагам си огледал кондензаторите, но аномалиите са твърде много и май всичките сочат южния мост....

Long shot. При работа(гледай как гръмко звучи...т.е. като е "пуснат да работи и няма картина") южният мост(пада се Ati SB600, Rev 00 щот` има вариации на модела и ревизиите) на първо четене - грее. Щом грее, значи сработва. Сработва ще рече минава си miniPOST-a(нямащ общо с BIOS), според който решава да остане ли включен или не. Ако имаше окъсяване или критична малфункция, щеше да откаже да се включи(следователно нямаше да загрява).

На второ четене, движейки се по диаграмата на SB600:

http://badmin.org/lolz-upld-archangel/AtiSB600.png (да не я пускам, че е широчка, а и без това е смалена вече)

Разиграваме проверките и дава пас. Т.е. в какво се състоят проверките: хващаш като пълен идиот едно мултицетче и почваш да мериш. Търси се липса или сериозно отклонение на напрежение плюс разбира се напрежение там където не би следвало да има. Всичко при мен е в рамките на нормалното. Т.е. изключително невероятно ще е проблемът при мен да опира в нещо по SB-то.

Трето финално, нещо което съм пропуснал да спомена - при мен има KBD startup check. Тоест, с думи прости - при пускане на системата премигват светлинките на клавиатурата(Num Lock, Caps Lock, Scroll Lock) и изгасват, точно както трябва да е. Извода - веригата "SB600->ENE KB926-> KBD Scan @ PS/2" е функционална. Това, от което имаме нужда в случая е да се скочи от Debug Port-a до BIOS-a(на диаграмата). Нещото което ги свързва е точно ENE KB926. Ако то бачка, подозренията падат върху другите 2 части.

Това, което чак сега ми прави впечатление е маркировката "USB 0 be debug port", което мисля и да разгледам какво точно ще рече :-o Въпреки, че диаграмата е шантава - за десктоп и за мобилни платформи, комбинирано и е абсолютно възможно това да е някаква екстра за преносими компютри(които, да се чудиш как, но от Ati са им спестили флопитата... :lol: ).

ПП. Ама хич не съм се заял да го оправя това нещо, а? Голяма съм скръндза - за 20-25 лева ще си потроша нервичките 8-)

Cybershot
01-28-2011, 07:05
Ти си мазохист да измериш дали напреженията нямат отклонения на SB...
Нещо изгубих нишката. Сега си с БИОС в.19 и барутника умря като куче? Ни приема ни отдава? Казваш че е работел непрекъснато, да не е прегрял?

GregoryHouse
01-28-2011, 15:07
Прочетох мнението ти преди час и чак сега отговарям. Може да съм пропуснал този малък дейтал евентуално. Да знам, колко дразнещ въпрос е това, но убеден ли си че скапаният проблем не идва от БИОС-а? Според мен си идва баш от там. Преди доста време имах проблем с едно компче и ако не ме лъже паметта беше или Фокси или от червените ливадки. И точно след един "успешен" префлаш на клиента не му изгря по същия начин дъното. Останах стерео. Изпратих дънцето на едни момчета, смениха чипа на биоса. Предположих, че нещо съм окъкал аз работата твърде фатално. Взех инструкциите на въпросния производител, изтеглих програмите които специално те са дали и са рекоменднали да се ползват. Стъпка по стъпка префлаш по инструкциите...грънци. Хайде сменяй чипа 2ри път... Предполагам, че нямаш възможността да смениш чипа, но ако имаш, ето ти една идейка :)

minus273dot15
01-28-2011, 22:26
Ти си мазохист да измериш дали напреженията нямат отклонения на SB...
Нещо изгубих нишката. Сега си с БИОС в.19 и барутника умря като куче? Ни приема ни отдава? Казваш че е работел непрекъснато, да не е прегрял?

Да, за версиите правилно си схванал. Компютъра си е с в.1(означението беше "AЛА-БАЛА-ПОРТОКАЛА-P1", а линка, който ми даде съпорта беше за "AЛА-БАЛА-ПОРТОКАЛА-P19". Пълна мъгла ми е защо го нарекоха "версия 19", тъй като означението за версия е съвсем различно(нещо от порядъка на "8007340334", т.е. само цифри). Но със съпорта и да искаш - не можеш да спориш, пък и няма смисъл за такива дребни неща.

И да, с в.1 вървеше перфектно(изключваме проблемите с дисковете), а с в.19 не баца(завърта всички вентилатори на макс, след секунда ги сваля чрез Cool'n'Quiet(на 33%), прави чек на клавиатурата и до там - остава си така). Другото което дразни - thermal throttling работи :shock: Т.е. като започне да грее, завърта вентилаторите по-бързо(как се тества - спира се на ръка един вентилатор, за да започне да грее повече компонента, след минутка всички вентилатори си увеличават оборотите).

Да е прегрял - не е прегрявал. Уж. Не мога да съм категоричен, но не е много вероятно. Намира се(последните няколко месеца) в изолирана стая, където я някой влезе един път на две седмици, я не влезе. Прахоляк, косми, глухарчета - няма как да ги засмуче. Отделно стаята е с климатик, който поддържа 10-15 градуса зимата и 15-20 градуса лятото.

Отделно, според логовете е свалян преди 3 месеца за профилактика:


Thermal Monitor Report[25/11/2010 17:49:32]
-------------------------------------------------------------------------
Thermal Monitors
-------------------------------------------------------------------------

Thermal monitor
Voltage 0 1.81 Volts (RAM VOLTAGE)
Voltage 1 1.38 Volts (CPU VOLTAGE)
Voltage 2 3.31 Volts (+3.3V, ORANGE)
Voltage 3 5.02 Volts (+5V, RED)
Voltage 4 12.06 Volts(+12V, YELLOW)
Voltage 5 5.01 Volts (+5VSB, PURPLE)
Voltage 8 3.31 Volts (VBAT)
Temperature 0 25°C (76°F)(PSU TEMP)
Fan 0 1248 RPM (PSU FAN)

PSU Register space LPC, base address = 0x0290

00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F
00 11 10 FF 01 37 FF 07 37 FF 07 58 0F 01 1C FF FF
10 FF FF FF 7B D7 80 7F FF 02 FF FF FF FF FF FF FF
20 72 4C 61 BD C9 FF FF FF CF 19 80 80 80 F0 FE FE
30 FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
40 FF FF FF FF FF FF 5F 74 2D 40 95 00 FF FF FF FF
50 17 08 7F 7F 7F 50 F8 56 90 56 04 12 E0 00 00 00
60 00 2D 41 20 A6 65 00 FF 00 2D 41 4C A6 65 00 FF
70 00 00 7F 40 00 65 00 FF FF FF FF FF FF FF FF FF
80 00 00 00 00 00 00 00 00 00 00 00 00 00 00 02 00
90 FF 00 00 00 FF 00 00 00 FF FF FF FF FF FF FF FF
A0 FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
B0 FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
C0 FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
D0 FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
E0 FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF
F0 FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF FF

Thermal monitor: AMD Athlox X2 5200+
Temperature 0 23°C (74°F) (Core #0, min)
Temperature 1 24°C (76°F) (Core #1, min)
Temperature 2 39°C (102°F) (Core #0, max)
Temperature 3 41°C (106°F) (Core #1, max)
Temperature 0 32°C (90°F) (Core #0, cur)
Temperature 1 32°C (91°F) (Core #1, cur)

Thermal monitor: ATI Radeon X1250 Moray
Temperature 0 34°C (93°F) (GPU Core, min)
Temperature 0 57°C (135°F) (GPU Core, max)
Temperature 0 53°C (128°F) (GPU Core, cur)

Thermal monitor: WD160AAJS
Temperature 0 23°C (74°F) (Assembly, min)
Temperature 1 17°C (63°F) (Air Flow, min)
Temperature 0 29°C (85°F) (Assembly, max)
Temperature 1 21°C (70°F) (Air Flow, max)
Temperature 0 25°C (78°F) (Assembly, cur)
Temperature 1 19°C (66°F) (Air Flow, cur)

Thermal monitor: WD160AAJS
Temperature 0 25°C (77°F) (Assembly, min)
Temperature 1 17°C (63°F) (Air Flow, min)
Temperature 0 31°C (88°F) (Assembly, max)
Temperature 1 21°C (70°F) (Air Flow, max)
Temperature 0 28°C (83°F) (Assembly, cur)
Temperature 1 19°C (66°F) (Air Flow, cur)

Thermal monitor: Fans
FAN1 1083rpm(CPU Fan, min)
FAN1 1641rpm(CPU Fan, max)
FAN1 1057rpm(CPU Fan, cur)
FAN2 1193rpm(Case Fan, min)
FAN2 1211rpm(Case Fan, max)
FAN2 1204rpm(Case Fan, cur)

Това горе е преди профилактиката. Температурите са малко височки, при положение, че температурата на околната среда беше максимум 20-тина градуса и пак, подчертавам, са около два пъти под максимално допустимите за системата. След почистването трябва да са паднали.

Какво означава "профилактика": компютъра се разкоства модул по модул, почиства се от прахоляк, пръска се с антистатичен спрей(за да не налепи нов прахоляк), вентилаторите се смазват(дори да няма нужда), слага се нова термопаста между радиаторите и охлажданите повърхности и всичко се сглобява обратно. Като гледам лога - случило се е в краят на ноември месец, миналата година - значи преди около 2 месеца.

И като ги навържем нещата - скорошна профилактика, контролирана среда, отделно е зима и няма жеги... не звучи логично да е прегрял(а и всичко по охлаждането в момента изглежда наред).

GregoryHouse, идеята за слагане на нов чип е... неосъществима. Първо ми трябва нов чип. Нали, това не е голям проблем, да речем че по някаква случайност намеря(поне сходен, който да запали до аварийно флашване). Проблема е, че е запоен директно за дъното. За да го сваля и да поставя новият ми трябва нещо от сорта на станция с горещ въздух, каквато нямам. А пък да оставим настрана факта, че има шанс(грубо казано 10-тина %) да не се получат добре спойките или да се разпои нещо друго. Малко не си заслужава инвестицията.

Засега нещата вървят в друга посока - напоследък изскочиха доста неща, с които да ме занимават, та ще го оставя за малко. Ако не се намери решение за проблема, ще пробутам процесора на някой(нали, 2х2.6GHz става да разцъкаш фейсбук и да си пуснеш някое филмче) и ще се преориентирам към Intel + малко повече памет. Не бързам. Реално подобен компютър би ми трябвал след месец-два, за да направя малко тестчета на него - разбирай 100-150 потребителя за бета система, която ако ще се рилийсва за публик - просто ще мигрира към някакви доста по-сериозни машини. Ама нали ги знаеш тия дето си дават парите - искат да видят точно какво е, защо е, по какъв начин работи и чак тогава си дават дингите. Но пък колкото до теста и AMD-то би се справило добре, ако не беше сгънало... даваше ъптайми от по над 2 месеца, при активно натоварване(нещо необичайно за AMD и то за low cost класът им :) ).

Уатевър. Отивам да обискирам хладилника, че трябва да разхождам някаква кучка. Всмисъл, женско куче и стопанката му, щото видиш ли - сами не можели, щели да се изгубят, щели да ги откраднат. Глупости. Само като ги видят на светло и веднага ще ги върнат, ако са направили грешката изобщо да ги вземат. А вънка се прожектира филма "Ледена Епоха, -10C"...

GregoryHouse
01-28-2011, 22:37
Знам, че е запоен директно за дъното. Знам и какво ти трябва за да го смениш. Предположих, че може пък да ти се намират подобни дрънкалки под ръка. А що се отнася до инвестиция, аз предпочитам да инвестирам малко пари, вместо много нерви, а от поста ти предположих, че си склонен на обратното. :) Ако пък случайно изкопаш чип, ако не ме лъже паметта хаудуеубг мисля, че ги сменяха. Въпреки това е някак си бутафорно да отидеш с въпросното дънце да ти сменят чипа, като за същите парици ще намериш новичко :)