När mm är en delare av nn, krävs särskilda restriktioner för både mm och nn för att säkerställa att både differensen nmn - m och kvoten n/mn / m också är naturliga tal. Om vi försöker definiera ‘differensen’ nmn - m eller ‘kvoten’ n/mn / m för godtyckliga naturliga tal mm och nn, måste vi lämna den naturliga talens värld. I de följande sektionerna kommer vi att konstruera nya typer av tal och på så sätt utvidga mängden av naturliga tal till större talteorier där dessa operationer kan användas (nästan) utan restriktioner. Naturligtvis måste dessa nya talstrukturer konstrueras så att de vanliga reglerna för addition och multiplikation fortfarande gäller. För detta ändamål är det mycket användbart att undersöka dessa regler på egen hand, oberoende av någon specifik talstruktur. En sådan undersökning ger oss också ytterligare träning i att härleda propositioner från definitioner och axiom.

I dessa sektioner handlar diskussionen mer om algebra än om analys, och vi kommer att hålla presentationen relativt kort och endast bevisa några av de viktigaste teoremerna. Vårt mål är att kunna känna igen allmänna algebraiska strukturer som dyker upp om och om igen i olika former. Genom att härleda ett stort antal aritmetiska regler från ett litet antal axiom, kan vi skapa ordning i en annars kaotisk samling av formler och resultat, och behålla vårt fokus på det väsentliga. De propositioner vi härleder från axiom är alltid sanna när axiom är sanna, oberoende av vilken kontext de gäller i. Saker som har bevisats en gång, behöver inte bevisas på nytt för varje särskilt fall. I denna och följande sektioner ger vi bara några konkreta exempel på de nya begreppen. Vi är huvudsakligen intresserade av att erbjuda ett språk, och hoppas att läsaren i senare sektioner ska känna igen nyttan med detta språk och också förstå det matematiska innehållet bakom formaliseringen.

Grupper är system som består av en mängd, en operation och tre axiom. Eftersom de har en så enkel algebraisk struktur, förekommer de överallt inom matematiken. Ett par (G,)(G, \circ), bestående av en icke-tom mängd GG och en operation \circ, kallas en grupp om följande gäller:

  1. \circ är associativ.

  2. \circ har ett identitetselement ee.

  3. För varje gGg \in G finns en invers hGh \in G sådan att gh=hg=eg \circ h = h \circ g = e.

En grupp (G,)(G, \circ) kallas kommutativ eller Abelisk om \circ är en kommutativ operation på GG. Om operationen är uppenbar från sammanhanget skriver vi ofta helt enkelt GG för (G,)(G, \circ).

Låt oss nu överväga några viktiga egenskaper som grupper uppvisar. Om vi har en grupp G=(G,)G = (G, \circ), så kan följande användbara egenskaper härledas:

(a) Identitetselementet ee är unikt. Detta innebär att om två element fungerar som identitet, så är de samma.

(b) Varje element gGg \in G har en unik invers g1g^{ -1}, och specifikt gäller att e1=ee^{ -1} = e.

(c) För varje par a,bGa, b \in G, finns ett unikt xGx \in G sådant att ax=ba \circ x = b, och ett unikt yGy \in G sådant att ya=by \circ a = b.

(d) För varje gGg \in G, gäller att (g1)1=g(g^{ -1})^{ -1} = g.

Detta leder till en viktig insikt: varje element i en grupp har en invers och denna invers är entydig. Detta är en grundläggande byggsten för att förstå algebraiska strukturer och hur grupper agerar under operationer.

Grupper är också användbara för att definiera och analysera andra algebraiska objekt som undergrupper och kvotgrupper. Om vi har en grupp G=(G,)G = (G, \circ) och en icke-tom mängd HH som är sluten under operationen \circ, dvs. om för alla h1,h2Hh_1, h_2 \in H, gäller h1h2Hh_1 \circ h_2 \in H, och om varje element hHh \in H har en invers i HH, då är HH också en grupp och kallas en undergrupp till GG. Detta leder oss till idén om coseter: om NN är en undergrupp av GG och gGg \in G, så definieras vänster-coset gNg \circ N och höger-coset NgN \circ g.

En särskild typ av undergrupp är den normala undergruppen, där gN=Ngg \circ N = N \circ g för alla gGg \in G. En sådan grupp möjliggör en intressant operation, nämligen att bilda kvotgrupper, som är en viktig konstruktion i gruppteori och andra områden inom algebra.

För att förstå grupper och deras struktur är det avgörande att förstå hur axiom som associativitet, existensen av ett identitetselement och inverser fungerar. Dessa grundläggande byggstenar för grupper gör det möjligt att definiera och manipulera komplexa algebraiska objekt på ett strukturerat sätt.

Vad är lösningen till linjära ekvationer för polynom i flera variabler?

I många tillämpningar av matematik, särskilt inom interpolering, dyker frågan upp om hur man kan hitta ett polynom som exakt passar en uppsättning data eller funktioner. En vanlig metod för att lösa detta problem är att använda linjära ekvationer för att bestämma koefficienterna för det polynom som bäst beskriver datamängden. Låt oss nu undersöka ett specifikt fall där man har ett system av linjära ekvationer, och se vad som krävs för att det ska vara lösbart.

Anta att vi har ett system av m+1m + 1 linjära ekvationer i m+1m + 1 okända, där dessa okända är koefficienterna för ett polynom. Detta system kan skrivas som en uppsättning ekvationer där varje ekvation relaterar koefficienterna för polynomet till olika kända värden av xx och yy.

En viktig aspekt av att lösa sådana system är att förstå hur determinantens värde för koefficientmatrisen påverkar lösbarheten. Om vi betraktar den så kallade Vandermonde-matrisen, som ofta uppträder i sådana sammanhang, ser den ut som en matris där varje rad består av potenser av de givna xx-värdena. Matrisen ser ut så här:

(1x0x02x0m1x1x12x1m1xmxm2xmm)\begin{pmatrix} 1 & x_0 & x_0^2 & \dots & x_0^m \\ 1 & x_1 & x_1^2 & \dots & x_1^m \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 1 & x_m & x_m^2 & \dots & x_m^m
\end{pmatrix}

Determinanten för denna matris, enligt linjär algebra, är inte bara en algebraisk formalitet, utan den är avgörande för att systemet ska ha en lösning. Om determinantens värde är noll, betyder det att systemet inte har en unik lösning, och om värdet är icke-noll, finns det en entydig lösning. Det är viktigt att förstå att det här resultatet gäller för alla möjliga val av den högra sidan i systemet. Det innebär att för ett givet set av xx-värden, kommer determinantens värde att avgöra om det går att hitta ett polynom som passar exakt dessa värden.

Det är också viktigt att lägga märke till att determinantens värde för denna matris kan uttryckas som produkten av skillnader mellan olika xx-värden. Formeln för detta är:

0i<jm(xixj)\prod_{0 \leq i < j \leq m} (x_i - x_j)

Denna formel förklarar varför det är så avgörande att xix_i och xjx_j är distinkta, det vill säga att inga två xx-värden är lika. Om två av dessa värden är lika, kommer determinanten att bli noll, och det kommer inte att finnas någon lösning för polynomet. Därför är det en grundläggande förutsättning för att systemet ska vara lösbart att alla xx-värden är olika.

En annan viktig aspekt att förstå är att även om determinantens värde är icke-noll, innebär det inte nödvändigtvis att lösningen till systemet alltid kommer att vara användbar eller meningsfull i praktiken. Det betyder bara att det finns en lösning, men om den inte stämmer överens med de praktiska behoven, kan det vara nödvändigt att överväga andra metoder eller justeringar av systemet för att hitta ett bättre resultat.

För den som använder denna metod inom interpolering kan det vara intressant att notera att även om Vandermonde-matrisens determinant är icke-noll, kan systemet vara känsligt för små förändringar i xx-värdena, vilket kan leda till stora förändringar i lösningarna. Detta är ett exempel på det så kallade "numeriska instabilitet", som kan uppstå när man arbetar med mycket stora eller mycket små tal i datorberäkningar. Detta fenomen kan göras mindre problematiskt genom att använda alternativa metoder, såsom att använda polynominterpolering med hjälp av Lagrange-polynom eller Newtons metoder, som ofta är mer stabila i numeriska tillämpningar.

Vidare kan det vara användbart att tänka på hur denna teori tillämpas på konkreta problem, som till exempel att approximera funktioner eller skapa kurvor som exakt träffar ett givet antal datapunkter. Inom datavetenskap och ingenjörsvetenskap används dessa tekniker ofta för att skapa modeller eller för att förutsäga resultat baserat på tidigare data.

Sammanfattningsvis är lösningen till ett system av linjära ekvationer för att hitta koefficienterna för ett polynom beroende av determinantens värde för Vandermonde-matrisen. För att säkerställa att en lösning finns måste alla xx-värden vara distinkta. Det är också viktigt att vara medveten om att numerisk instabilitet kan uppstå om lösningen används för att approximera verkliga funktioner, och därför kan alternativa metoder behövas för att hantera sådana problem.

Hur relativt öppna och stängda mängder definieras i olika topologiska rum

Om MYXM \subseteq Y \subseteq X där XX är ett metrisk rum, är en mängd MM relativt öppen i YY om och endast om MM är öppen i YY med den relativa topologin som induceras från XX. Detta innebär att varje punkt xMx \in M har en omgivning i YY som också är öppen i YY. På samma sätt, MM är relativt stängd i YY om och endast om dess komplement YMY \setminus M är öppet i YY. Detta grundläggande samband mellan öppna och stängda mängder i delmängder av ett topologiskt rum är centralt i förståelsen av hur öppna och stängda mängder beter sig i olika rum.

För att förstå detta bättre, låt oss analysera ett par exempel. Antag att X=R2X = \mathbb{R}^2, Y=R×{0}Y = \mathbb{R} \times \{0\}, och M=(0,1)×{0}M = (0, 1) \times \{0\}. Här är MM öppen i YY, men inte i XX, eftersom det inte finns någon omgivning i XX som är helt innesluten i MM. Å andra sidan, om vi tar X=RX = \mathbb{R} och Y=(0,2]Y = (0, 2], så är intervallet (1,2](1, 2] öppet i YY, men inte i XX, medan (0,1](0, 1] är stängt i YY, men inte i XX.

Det är också viktigt att förstå hur dessa begrepp fungerar i mer allmänna topologiska rum, utanför den specifika ramen för metrisk geometri. I ett allmänt topologiskt rum kan definitionerna av öppna och stängda mängder i delmängder av XX vara mer subtila, och vissa av de egenskaper vi ser i metriska rum kanske inte håller. Till exempel, en mängd kan vara relativt öppen i ett rum utan att vara öppen i hela rummet. För att vara exakt i denna kontext är det avgörande att hålla i åtanke definitionen av en relativt öppen mängd: MYM \subseteq Y är relativt öppen om det finns en öppen mängd OO i XX sådan att M=OYM = O \cap Y. Denna definition leder till förståelsen av hur öppna mängder i subrum fungerar och ger oss verktyg att arbeta med mer komplexa topologiska strukturer.

Vidare är det centralt att förstå att i ett topologiskt rum kan det finnas mängder som inte är öppna eller stängda i rummet självt men som uppvisar sådana egenskaper i relation till underdelmängder eller med hjälp av en given subtopologi. Ett exempel på detta är begreppet av ett relativt stängt set i ett subrum, vilket innebär att komplementet till mängden i subrummet är öppet i subrummet.

Ett av de viktigaste resultaten är att en mängd MM är öppen i YY om och endast om komplementet YMY \setminus M är stängt i YY. Detta gäller för alla topologiska rum och ger oss ett kraftfullt sätt att förstå förhållandet mellan öppna och stängda mängder. Detta samband är också nära relaterat till begreppet "interiörpunkt" i ett topologiskt rum: en punkt i MM är en interiörpunkt om det finns en omgivning som helt ligger inom MM.

För att generalisera dessa begrepp vidare, skulle det vara bra att komma ihåg att begreppen relativt öppet och relativt stängt inte är begränsade till att bara gälla i metriska rum. De är tillämpliga även i allmänna topologiska rum, och förståelsen av dessa begrepp är nyckeln till att arbeta med underkomponenter i mer komplexa rum. Att känna till hur de relaterar till de övergripande topologiska egenskaperna hos rummet gör det möjligt att analysera topologiska strukturer mer effektivt.

Den relativa topologin på en mängd YY i ett topologiskt rum XX definieras som den mängd av öppna mängder i XX som också är öppna i YY. Detta innebär att (Y,TY)(Y, T_Y) är ett topologiskt rum i sig, vilket betyder att varje delmängd av YY som är öppen i YY också är öppen i XX. Detta skapar en övergång mellan rum och subrum där vi kan använda topologiska begrepp som kontinuitet, konvergens och gränser på ett sätt som bevarar dessa egenskaper när vi arbetar med undersystem av ett större topologiskt rum.

Det är också värt att notera att i vissa fall kan en funktion mellan topologiska rum vara kontinuerlig även om den inte bevarar öppna mängder i samma sätt som i metriska rum. När XX och YY är topologiska rum, sägs en funktion f:XYf: X \to Y vara kontinuerlig om för varje öppen mängd UYU \subseteq Y, är preimage f1(U)f^{ -1}(U) också öppen i XX. Detta resultat ger ett centralt kriterium för att identifiera kontinuerliga funktioner i allmänna topologiska rum och knyter an till de mer avancerade begreppen om gränser, konvergens och de olika egenskaper som kan vara beroende av rummet och de topologiska strukturerna.