PCI-Scan



  • Und man erhält die Vendor- und die DeviceID immer nur zusammen. Niemals getrennt. Darum kommt das mit einem Offset auch nicht hin. Im (32 bit breitem) Register Nr. 0 hat der Hardwarehersteller eben zwei Informationen abgelegt, die sich nur zusammen auslesen lassen.



  • Wie gesagt.

    XanClic schrieb:

    Ich revidiere meine Meinung, wenn du mir glaubhaft vermitteln kannst, dass das [DWord an Offset 0x0C] ein Register und nicht vier sind.

    😉

    EDIT: Ich möchte nachtragen, dass ich jetzt besser verstehe, was du meinst, auch wenn ich noch nicht genau der gleichen Meinung bin. 🙂



  • Du solltest Begriffe lieber so benutzen, wie sie definiert sind und wie sie der Rest der Welt benutzt, nicht so wie du es für logischer hältst.

    Du kannst CONFIG_ADDRESS nur auf einen 32-Bit-alignten Wert setzen, richtig. Du kannst die Register aber einzeln auslesen, indem du ein 16-Bit- oder 8-Bit-in auf CONFIG_DATA machst. Nur beim Class Code funktioniert das wieder nicht so gut, weil es kein 24-Bit-in gibt...



  • Um zum ursprünglichen Thema von wegen "& 0xFC" zurückzukommen... Linux tut es. Hierzu der Code zum Lesen eines Registers:

    #define PCI_CONF1_ADDRESS(bus, devfn, reg) \
            (0x80000000 | ((reg & 0xF00) << 16) | (bus << 16) \
            | (devfn << 8) | (reg & 0xFC))
    
    static int pci_conf1_read(unsigned int seg, unsigned int bus,
                              unsigned int devfn, int reg, int len, u32 *value)
    {
            unsigned long flags;
    
            if ((bus > 255) || (devfn > 255) || (reg > 4095)) {
                    *value = -1;
                    return -EINVAL;
            }
    
            spin_lock_irqsave(&pci_config_lock, flags);
    
            outl(PCI_CONF1_ADDRESS(bus, devfn, reg), 0xCF8);
    
            switch (len) {
            case 1:
                    *value = inb(0xCFC + (reg & 3));
                    break;
            case 2:
                    *value = inw(0xCFC + (reg & 2));
                    break;
            case 4:
                    *value = inl(0xCFC);
                    break;
            }
    
            spin_unlock_irqrestore(&pci_config_lock, flags);
    
            return 0;
    }
    

    Mit diesem Code kann man, wie schon von taljeth angesprochen, auch 16- und 8-Bit-Register auslesen.



  • taljeth schrieb:

    Du solltest Begriffe lieber so benutzen, wie sie definiert sind und wie sie der Rest der Welt benutzt, nicht so wie du es für logischer hältst.

    Daran arbeite ich ja. 🙂

    Bits Nr.
    | Register | Offset | 31-24 |    23-16    |    15-8       |      7-0        |
    |   0x03   |  0x0C  | BIST  | Header Type | Latency Timer | Cache Line Size |
    

    CONFIG_ADDRESS ist auf Register 0x03 und/oder Offset 0x0C gesetzt. Was liefert nun ein 8-bit-IN (immer und ewig)?



  • XanClic schrieb:

    Um zum ursprünglichen Thema von wegen "& 0xFC" zurückzukommen... Linux tut es.

    tyndur tut es auch und Erhard hat doch sogar explizit gefragt, wie die Funktion funkioniert.

    +gjm+ schrieb:

    Bits Nr.
    | Register | Offset | 31-24 |    23-16    |    15-8       |      7-0        |
    |   0x03   |  0x0C  | BIST  | Header Type | Latency Timer | Cache Line Size |
    

    CONFIG_ADDRESS ist auf Register 0x03 und/oder Offset 0x0C gesetzt. Was liefert nun ein 8-bit-IN (immer und ewig)?

    Du verwirrst mich schon wieder mit deinen Begriffen. CONFIG_ADDRESS hat nur einen Wert, ich hoffe mal, dass 0x0c das ist, was du meinst. Ein Byte-read von CONFIG_DATA würde dann den Wert von Cache Line Size lesen. Eins von CONFIG_DATA + 2 würde den Subclass Code lesen.


  • Mod

    Bits Nr.
    | Register | Offset | 31-24 |    23-16    |    15-8       |      7-0        |
    |   0x03   |  0x0C  | BIST  | Header Type | Latency Timer | Cache Line Size |
    

    Wo finde ich das mit dem Register 0x03? Das habe ich bisher so nicht gesehen, nur immer register number == offset. Vermutlich liegt darin ein Teil der Missverständnisse bezüglich Offset & 0xFC und Register << 2 begraben.



  • Soweit ich das verstanden habe, ist das mit dieser Registernummer einfach nur eine Erfindung von +gjm+. Er versteht darunter Offset >> 2 und hält es offenbar aus irgendeinem Grund für sinnvoll, damit zu arbeiten, auch wenn keiner auf Anhieb versteht, was er meint.


  • Mod

    Erfindung von +gjm+

    @+gjm+: Ist das wirklich so, oder gibt es das auch von offizieller Seite? 😃

    Die Wissenschaft neigt auch mehr zum Offset:
    http://techwww.in.tu-clausthal.de/site/Projekte/PCI-Tutorial-Konfiguration//bilder/pci_config_header.gif

    Hier ist auch eine interessante Darstellung der letzten zwei Bits als "Type":
    http://www.martin-schreiber.net/data/pages/progref/bussysteme/pci/configaddress.gif

    00b = Konfigurationszyklus
    01b = Einheit ist hinter dieser Bridge. Diese kopiert den Inhalt von CONFIG_ADDRESS unverändert auf den Adress-/Datenbus
    10b = ?
    11b = ?


  • Mod

    Einschub nur zum Festhalten in diesem Thread bezüglich BARs und IRQ:
    https://ezs.kr.hsnr.de/lectures/treiber/html/x2161.html

    Base Address

    Bis zu 6 unterschiedliche Speicher- oder IO-Bereiche kann ein Gerät besitzen. Die Adressen dieser Bereiche werden in den Zellen Base Address 0 bis Base Address 5 abgelegt. In so einer Speicherzelle ist die Adresslage, die Art und auch die Größe des Speicherbereiches kodiert.

    Ein Speicherbereich hat eine Mindestgröße von 16 Byte und ist immer ein Vielfaches von 2. Dadurch stehen die 4 unteren Bits für zusätzliche Codierungen zur Verfügung. Bit 0 gibt Auskunft darüber, ob es sich um eine IO Adresse (der Zugriff muß über Port-Befehle erfolgen) oder eine Memory Adresse handelt. Handelt es sich um eine Memory Adresse, geben Bit 1 und 2 den Adresstyp an. 00 signalisiert, dass es sich um eine gewöhnliche 32 bit Adresse handelt. Die Kombination 01 bedeutet, dass die Adresse unterhalb der aus alten Zeiten bekannten 1 Megabyte Grenze liegt und die Kombination 10 wird für eine 64 bit Adresse verwednet. Bei einer 64 bit Adresse werden zwei „Base Address“ Einträge zur Adressbestimmung gebraucht.

    Bit 3 schließlich gibt Auskunft darüber, ob auf diesen Adressbereich im Prefetch-Mode zugegriffen werden darf oder nicht. Ein gesetztes Bit bedeutet dabei, dass nicht im Prefetch-Mode zugegriffen werden darf. Im Prefetch-Mode speichert die PCI-Bridge (d.h. der Baustein, der den PCI-Bus an den Processorbus ankoppelt) Daten zwischen, bevor die eigentliche Übertragung zur CPU (lesen oder schreiben) gestartet wird.

    Laut Spezifikation sind nur die Bereiche der Base Address auch schreibbar, die die Adresslage festlegen. Die übrigen Bits bleiben 0. Dieser Umstand wird genutzt, um die Größe eines Adressbereiches zu bestimmen. Dazu beschreibt man das Adressregister mit lauter Einsen und liest das Register wieder aus. Die Bits, die jetzt mit 0 belegt sind, identifizieren die Adressbereichgröße.

    Das folgende Codefragment zeigt, wie die Größe des Speicherbereiches bestimmt werden kann:

    pci_read_config_dword( PciDev, PCI_BASE_ADDRESS_0, &OrginalValue );
            cli();
            pci_write_config_dword( PciDev, PCI_BASE_ADDRESS_0, 0xffffffff );
            pci_read_config_dword( PciDev, PCI_BASE_ADDRESS_0, &Base );
            pci_write_config_dword( PciDev, PCI_BASE_ADDRESS_0, OrginalValue );
            sti();
            printk("size of base address 0: %i\n", ~Base+1 );
    

    IRQ-Line

    In dieser Speicherzelle findet sich der Interrupt, der dem Board vom PCI-Bios zugeteilt wurde.

    Hauptseite, die mir bezüglich Treiber wirklich interessant erscheint:
    https://ezs.kr.hsnr.de/lectures/treiber/html/book1.html



  • Na gut. Letzter Versuch. Mit dem von XanClic geposteten Code kann man gezielt ein Byte aus dem "Config-Space" auslesen:

    case 1:
     *value = inb(0xCFC + (reg & 3));
      break;
    

    Aber dazu muß u.U. die Portadresse geändert werden. Das ist nur typisch für den Zugriff auf (Hardware) Register. 🙂

    P.S.: Im Internet werden Falschmeldungen zu Tatsachen einzig und alleine durch Verbreitung.


  • Mod

    Bei mir sieht das nun praktisch wie folgt aus:

    #include "pci.h"
    
    static uint32_t pci_config_read(uint32_t bus, uint32_t device, uint32_t func, uint32_t reg)
    {
        outportl(PCI_CONFIGURATION_ADDRESS,
            0x80000000
            | (bus    << 16)
            | (device << 11)
            | (func   <<  8)
            | (reg & 0xFC  )); // Real hardware ignores bits 0 and 1, and reads only bits 7-2.
                               // The bit mask FCh = 11111100b ensures register numbers aligned with 4.
    
        return inportl(PCI_CONFIGURATION_DATA);
    }
    
    uint32_t pci_config_read_32 (uint32_t bus, uint32_t device, uint32_t func, uint32_t reg)
    {
        return pci_config_read(bus, device, func, reg);
    }
    
    uint16_t pci_config_read_16 (uint32_t bus, uint32_t device, uint32_t func, uint32_t reg)
    {
        return pci_config_read(bus, device, func, reg) & 0xFFFF;
    }
    
    uint8_t pci_config_read_8 (uint32_t bus, uint32_t device, uint32_t func, uint32_t reg)
    {
        return pci_config_read(bus, device, func, reg) & 0xFF;
    }
    
    void pci_config_write(uint32_t bus, uint32_t device, uint32_t func, uint32_t reg, uint32_t val)
    {
        outportl(PCI_CONFIGURATION_ADDRESS,
            0x80000000
            | (bus     << 16)
            | (device  << 11)
            | (func    <<  8)
            | (reg & 0xFC   ));
    
        outportl(PCI_CONFIGURATION_DATA, val);
    }
    

    Die write-Funktion benötigen für die BARs (siehe oben).

    Bei tyndur ist der Schutz übrigens mit ... &=~11b und ... &11111100b m.E. übertrieben:

    static dword pci_config_read(..., dword reg)
    {
        ...
        reg &= ~0x3;
        outl(... | ((reg & 0xFC)));
        ...
    }
    

    Ich würde vorschlagen, eine von beiden Schutzmasken zu entfernen. Dann läuft der PCI Scan deutlich schneller. 😉



  • Deine pci_config_read_16 und pci_config_read_8 können übrigens keine Werte, die nicht 4 Byte aligned sind, lesen. Nicht dass du dich z.B. irgendwann wunderst, dass du damit nicht die Device ID nicht auslesen kannst.


  • Mod

    Ja, das ist richtig und mir zum Glück auch klar. Das ist noch nicht optimal. Die DeviceID habe ich mir z.B. so berechnen müssen: (pciDevVend&0xFFFF0000)>>16 🙂

    Die Funktionen sind wirklich noch nicht bahnbrechend. Da könnte man z.B. noch einen Start-Parameter pos (von Byte 0 aus gerechnet) einführen mit 0,1,2,3. Würde das Sinn machen? Vielleicht sogar nur eine Funktion mit pci_config_read_value(bus,dev,func,reg,width,pos) und uint32_t als return type.

    IRQ (Version 110 in Arbeit) klappt auch sehr gut (Vergleich PCI Scan mit BIOS-PCI-Auflistung per Foto), lediglich das IDE-Interface mit IRQ 14/15 wurde vom PrettyOS PCI Scan mit IRQ 0 angezeigt. Die beiden USB-Devices haben beide IRQ 9, so dass man das IRQ sharing hiermit erkennen kann.

    Nun kommt das Thema BARs.


  • Mod

    Zum Thema maskieren mit 0xFC eine Antwort bei osdev.org:
    http://forum.osdev.org/viewtopic.php?f=1&t=21098

    The rule is, you can only read doublewords from configuration space. If you don't I have enough pieces of real hardware that make your code fail.
    It is your choice whether you need the 0xfc or not.



  • Erhard Henkes schrieb:

    Hier ist auch eine interessante Darstellung der letzten zwei Bits als "Type":
    http://www.martin-schreiber.net/data/pages/progref/bussysteme/pci/configaddress.gif

    00b = Konfigurationszyklus
    01b = Einheit ist hinter dieser Bridge. Diese kopiert den Inhalt von CONFIG_ADDRESS unverändert auf den Adress-/Datenbus
    10b = ?
    11b = ?

    Da ist was durcheinandergeworfen worden. Das Bild zeigt, was auf dem Bus übertragen wird, nicht das CONFIG_ADDRESS-Register.

    Und zum 0xfc, lies dir einfach mal selbst Abschnitt 3.2.2.3.2. in der Spezifikation durch. Auf CONFIG_ADDRESS darfst du nur dwords schreiben und Bits 0 und 1 sind read-only und auf 0 hartverdrahtet. Ich würde es trotzdem drinlassen, weil auch Hardware buggy sein kann. Um genau zu sein, liest meine Funktion ja sogar immer von der abgerundeten Adresse und schiebt das Ergebnis hinterher so zurecht, dass ich genau das Register bekomme, das ich angefordert habe.



  • +gjm+ schrieb:

    Aber dazu muß u.U. die Portadresse geändert werden. Das ist nur typisch für den Zugriff auf (Hardware) Register. 🙂

    Der I/O-Port hat doch nix mit dem Konfigurationsadressraum zu tun. Ich schreibe die Adresse im Konfigurationsraum nach 0xCF8. Dann steht ab 0xCFC automatisch der Wert des adressierten DWords. Das heißt nicht, dass diese DWord in 0xCFC steht und ich an 0xCFD was völlig anderes auslese. In 0xCFC steht das niederwertigste Byte dieses DWords. In 0xCFD das zweite, in 0xCFE das dritte und in 0xCFF das höchstwertige Byte (Little Endian). Wenn ich also ein Word ab 0x02 auslesen möchte, fordert diese Linuxfunktion das DWord ab 0x00 an, ab 0xCFC steht dann dessen Wert. Die Linuxfunktion liest dann also ein Word ab 0xCFE ein, das heißt, das niederwertige Byte aus 0xCFE und das höherwertige Byte aus 0xCFF (geschieht automatisch mit inw).
    Ich hoffe, ich habe deinen Einwand verstanden und hoffe auch, dass ich verständlich antworten konnte. 😉



  • Sehr gut beschrieben. 👍

    XanClic schrieb:

    Ich schreibe die Adresse im Konfigurationsraum nach 0xCF8.
    Dann steht ab 0xCFC automatisch der Wert des adressierten DWords.

    Für die Bildung der "Adresse" stehen aber nur Bit 7-2 zur Verfügung. (Bit 1-0 sind reserviert). Somit geht der Bereich von "Adresse" nur von 0x00-0x3F. Die Darstellung des "Config-Space" mit einem "Offset" links oder rechts der Tabelle ist deshalb falsch. Hoffentlich war das verständlich. Didaktisch begabt bin ich leider nicht. Aber ich arbeite daran. 🙂



  • Die offizielle Spezifikation als falsch zu bezeichnen ist zumindest mutig. 😉



  • +gjm+ schrieb:

    Für die Bildung der "Adresse" stehen aber nur Bit 7-2 zur Verfügung. (Bit 1-0 sind reserviert).

    Es gibt jede Menge Beispiele, in denen man z. B. in ein 32-Bit-Feld eine Adresse eintragen muss, wo aber die unteren 4 Bits oder so reserviert sind (siehe z. B. die OHCI-Spezifikation, Abschnitt 4.2.1 "Endpoint Descriptor Formats" und dort das Feld "TD Queue Tail Pointer", hier sind die unteren Bits nicht reserviert, sondern stehen für den Programmierer frei zur Verfügung). Im erwähnten Beispiel ist in den Bits 4 bis 31 eine Adresse einzutragen. Man trägt dort aber nicht die Bits 0 bis 27 der Adresse ein, sondern die Bits 4 bis 31. Dass die unteren 4 Bits von der Hardware ignoriert werden, heißt hier nur, dass die Adresse an 16 Bytes ausgerichtet sein muss.
    Und genau so wird es bei PCI auch sein, dass die unteren 2 Bites ignoriert werden, heißt nur, dass die Adresse an 4 Bytes ausgerichtet sein muss.


Anmelden zum Antworten