Från början av maskininlärningens era var det en stor utmaning att arbeta med stora mängder märkt data, vilket ledde till höga bearbetningskostnader. Denna problematik minskade avsevärt när forskare började skapa stora, välmärkta dataset som ImageNet, CIFAR-10, CIFAR-100 och MNIST-databasen. Samtidigt förbättrades parallell bearbetning genom grafiska processorer (GPU) och stora distribuerade kluster, vilket gjorde det möjligt att hantera de enorma datamängderna effektivt. Dessa teknologiska framsteg gjorde det också möjligt att utveckla mer komplexa och precisa bildklassificeringssystem.

Ett viktigt steg i utvecklingen av datorseende var ImageNet Large Scale Visual Recognition Challenge (ILSVRC), som spelade en avgörande roll för att driva fram djupa neurala nätverk. Genom att erbjuda en gemensam standard att mäta bildklassificeringssystem emot, gjorde denna tävling det enklare att bygga och utvärdera mer komplexa nätverksstrukturer. Två viktiga system som uppstod ur denna tävling var VGG-nätverket (VGG-Net) och Residual Network (ResNet).

VGG-Net, skapat av Simonyan och Zisserman 2014, hade en betydande inverkan på utvecklingen av djupare nätverksstrukturer. Genom att använda små 3x3-konvolutionsfilter kunde nätverket upptäcka detaljer i bilder samtidigt som antalet parametrar hölls under kontroll. Detta designval gjorde det möjligt att bygga nätverket med 16–19 viktlager och uppnå en noggrannhet på 7,3 % vid ILSVRC 2014. Den ökade djupet på nätverket ledde till förbättrad klassificeringsprestanda och satte ett nytt standard för CNN-arkitektur.

ResNet, introducerat av Microsoft Research Asia 2015, ledde till en banbrytande förändring med sitt 152-lagers nätverksdesign. Huvudgenombrottet med ResNet var begreppet residualinlärning, där nätverket lärde sig residualfunktioner istället för att bara försöka lära sig den avsedda underliggande kartläggningen. Denna metod gjorde det möjligt att optimera mycket djupa nätverk genom att hantera degraderingsproblemet, som innebär att prestandan försämras när fler lager läggs till. ResNets design utnyttjade den större nätverksdjupet till fullo och resulterade i en förbättrad noggrannhet, vilket ledde till att det vann ILSVRC 2015 med en låg felprocent på 3,6 %.

Byggt på dessa banbrytande verk, syftar vårt projekt, Deep Learning for Anomaly Detection and Classification (DLADC), till att använda transferinlärningsmetoder och anpassa dessa topp-presterande nätverksdesigns för att förbättra anomalidetektion och klassificering. Genom att utnyttja de unika egenskaperna hos VGG-Net och ResNet hoppas vi kunna expandera gränserna för detektion och klassificering av avvikelser, vilket ökar både noggrannheten och effektiviteten i att identifiera och sortera avvikelser i olika dataset.

Den tekniska utvecklingen kring att använda konvolutionella neurala nätverk (CNN) för att undersöka och identifiera defekter i halvledare har också expanderat. CNN har överlägsna förmågor jämfört med traditionella maskininlärningsmetoder. De kan lära sig komplexa mönster direkt från bilder på halvledare, utan behov av att människor skapar specifika funktioner. Detta gör dem särskilt användbara i chip- och waferproduktion, där de kan upptäcka små defekter som kan indikera tillverkningsproblem.

Det som gör CNN så effektiva inom detta område är deras förmåga att identifiera mönster och strukturer i bilder på halvledare. Genom att använda konvolutions- och poolingslager kan nätverken upptäcka detaljer på olika nivåer, vilket gör det möjligt att hitta mycket små fel såsom partiklar, repor eller mönsterändringar som kan påverka tillverkningen av chip. Tack vare deras flexibilitet kan CNN även anpassa sig till variationer i bilder som orsakas av olika tillverkningsmetoder, material och utrustningsinställningar.

För att tränas på att känna igen och identifiera defekter i halvledare används ofta specifika märkta dataset som SEMI:s standarder för defekter i halvledartillverkning. Dessutom möjliggör hårdvaruacceleratorer som GPU:er och specialiserade acceleratorer en smidig integration av CNN-baserade inspektionssystem i chipfabriker, vilket både förbättrar produktiviteten och skalar upp processerna.

För att bearbeta bilder från halvledartillverkning krävs noggrant förberedelse av data innan de används för maskininlärning. Vanligtvis används flera metoder för att förbättra bilddata så att den blir mer användbar och exakt för analys. Detta inkluderar noggrann insamling och märkning av bilder från olika tillverkningssteg, inklusive waferbilder, die-bilder och specifika defekter. Metadata, såsom wafer-ID och tillverkningssteg, läggs också till för att ge bakgrundsinformation som kan underlätta senare analyser.

Insamlingen av bilder under tillverkningsprocessen, som görs i kontrollerade miljöer som rena rum, samt användningen av automatiserade bildsystem och högupplösta kameror, gör det möjligt att få detaljerade bilder av varje steg. Dessa bilder används sedan för att upptäcka defekter genom automatiserade algoritmer eller manuella inspektioner, och varje defekt märks noggrant för vidare analys.

I halvledartillverkningen, där små defekter kan ha stor inverkan på produkten, spelar dessa avancerade bildklassificeringstekniker och maskininlärning en avgörande roll för att säkerställa kvalitén och effektiviteten i produktionen. Genom att utnyttja dessa system kan tillverkningsprocesserna optimeras och produktkvaliteten förbättras, vilket gör halvledartillverkning mer exakt och pålitlig.

Hur doping påverkar känsligheten och prestandan hos BioFET-biosensorer

Inom det senaste decenniets utveckling av biosensorer har BioFET (biologisk fälteffekttransistor) framträtt som en lovande teknik för detektion av biomolekyler. En särskild fördel med denna teknik är dess förmåga att detektera en mängd biomolekyler med olika dielektriska konstanter och laddningsdensiteter, vilket gör den till ett kraftfullt verktyg för medicinsk diagnostik och miljöövervakning. För att bättre förstå hur dessa sensorer fungerar är det viktigt att undersöka de tekniska parametrarna och metodologierna som styr deras prestanda.

För att undersöka känsligheten och effektiviteten hos BioFET används numeriska simuleringar, där ATLAS TCAD-simulatorn spelar en central roll. Genom att implementera specifika modeller, som Shockley-Read-Hall-modellen (SRH) och olika mobilitetsmodeller beroende på koncentration och elektriska fält, kan vi efterlikna de verkliga förhållandena i en BioFET:s drift. En av de mest intressanta aspekterna av dessa simuleringar är hur biomolekyler påverkar sensorns prestanda, särskilt genom att förändra kapacitansen hos gate-oxiden och det elektriska fältet längs kanalens längd.

När en biomolekyl, som DNA eller streptavidin, introduceras i kaviteten hos en BioFET med en dielektrisk konstant som skiljer sig från luftens (K = 1), påverkar detta threshold-spänningen. Threshold-spänningen är ett mått på den spänning som krävs för att aktivera FET-enheten, och en förskjutning i denna spänning kan användas som ett kvalitativt mått på biosensorernas känslighet. För olika biomolekyler med varierande dielektriska konstanter och laddningsdensiteter varierar denna förskjutning, vilket ger värdefull information om biomolekylens interaktion med sensorn.

När det gäller doping av käll- och dräneringsregionerna i BioFET, är det viktigt att förstå effekterna av olika dopingnivåer. En ökning av dopingnivåerna i dessa regioner leder till två primära effekter. För det första tenderar en högre dopingkoncentration att minska den effektiva kanalens längd, vilket påverkar hur lätt eller svårt det blir att aktivera sensorn vid en given spänning. Detta kallas Effekt 1. För det andra, vid låga dopingnivåer, breddas depleteringszonen och den effektiva kanalens längd ökar, vilket gör att threshold-spänningen ökar och därmed känsligheten ökar – detta är Effekt 2.

Dessa två effekter påverkar varandra beroende på dopingnivån, och en balans mellan känslighet och ledningsförmåga måste uppnås för att optimera BioFET-prestanda. Vid låga dopingnivåer är känsligheten för biomolekyler mycket hög, men ledningsförmågan minskar, vilket kan begränsa användningen av dessa nivåer i praktiska tillämpningar. Därför är det viktigt att välja rätt dopingnivå för att säkerställa att både känsligheten och ledningsförmågan är optimal för de specifika tillämpningarna, såsom detektion av cancerbiomarkörer eller neurodegenerativa sjukdomar.

I experimentella tester, såsom detektering av urikas, streptavidin eller kolesteroloxidase, har BioFET visat sig vara extremt känslig för förändringar i biomolekylernas dielektriska egenskaper. Till exempel, för streptavidin (Kbio = 2,1) observerades en förskjutning på 74,59 mV i threshold-spänningen, vilket indikerar en signifikant respons på denna biomolekyl. På samma sätt kan andra biomolekyler som används i immunoassays eller biokatalys ge mätbara förändringar i spänning som kan användas för diagnos och övervakning.

Det är också av betydelse att förstå effekterna av olika biomolekylers laddning på sensorns känslighet. Laddade biomolekyler, som DNA eller aminosyror, tenderar att ha en starkare inverkan på threshold-spänningen jämfört med neutrala biomolekyler. Detta beror på att laddade molekyler interagerar mer direkt med det elektriska fältet i kanalens struktur, vilket gör att de kan orsaka större förändringar i spänningen. Därför kan det vara användbart att kombinera både laddade och neutrala biomolekyler i en omfattande biosensortestning för att få en bredare förståelse för sensorernas prestanda.

Genom att förstå dessa interaktioner kan forskare och ingenjörer vidareutveckla BioFET-biosensorer för att göra dem ännu mer känsliga och specifika för olika biomolekyler. Detta öppnar upp möjligheter för tidig upptäckt av sjukdomar som cancer, Alzheimer och hepatocellulär cancer, där biomolekyler spelar en avgörande roll i sjukdomsprocessen. För att nå detta mål krävs att man finjusterar parametrar som doping, kanalens längd och dielektriska egenskaper hos de biomolekyler som ska detekteras.