-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Brainstorm intermediate layer representations #494
Comments
One of the screenshots I added to discord came from #389 |
https://de.mathworks.com/help/fusion/examples.html?category=lidar-tracking&s_tid=CRUX_topnav Zwei Gedanken: Unser aktueller Ansatz würde darauf beruhen, dass wir die Bild-Segmentierungen mit den Lidar-Daten (depth_array) verschmelzen und uns hieraus dann die Objekte und 3D-Boxen der Autos erstellen. Im obigen Link gibt es einige Beispiele, hier wäre in meinen Augen auch sinnvoll zu prüfen, ob wir die Kamera-Daten überhaupt benötigen, denn hier wird gezeigt, dass dies auch rein mit Lidar-Daten möglich wäre. Für die Spur-Erkennung werden wir wohl nicht an den Kameradaten vorbeikommen aber für Autos, Fußgänger, Fahrradfahrer würde das glaube ich reichen. Hier ist dann auch der Vorteil, dass wir keine extra Kameras brauchen. Die vordere Kamera würde dann nicht mehr für die Objekt / Hinderniserkennung, sondern für Spurhalten, Schilder, Ampeln etc. verwendet werden und die Lidar-Daten, die wir aktuell bereits haben könnten uns dann problemlos alle Objekte 360° um das Auto geben. Zweiter Gedanke ist bezüglich den Boxen. Wenn wir nur links und rechts die Segmentierungsdaten mit den Tiefen vergleichen werden wir einen Punkt, und zwar die Ecke des Objektes, das am nächsten zu uns steht, vernachlässigen. Eine Idee um dies nicht zu vernachlässigen wäre folgende: Da wir nicht sicher sein können, dass an den Rändern evtl. die Segmentierungsmaske nicht passt müssen wir jeweils mehrere Punkte verwenden um eine Region zu mitteln (das gilt generell, ob für den zwei Punkt oder drei Punkt Ansatz). Evtl. auch mit einer anderen, eleganteren Methode als Mitteln. Hier brauchen wir dann 6 Punkte: Links oben, Links unten, nähester Punkt zu uns oben, nähester Punkt zu uns unten, Rechts oben, Rechts unten. |
Zum Thema Lane Detection: Es wäre an sich möglich die Lidar daten zu nehmen um die Erkennung von den Spuren zu machen, jedoch sind die besten und stabilsten Modelle momentan auf Kameradaten angewiesen, mir ist ein Paper zu dem Thema aufgefallen, das ein Selfsupervised learning Model verwendet, aber das war eher eine Kombination aus 6 Kameras, 5 Radaren und 1 Lidar, was meiner Meinung nach die Grenze der zugelassenen Sensoren für das Qualify überschreitet zudem enorm viel Kapazität der VRAM für die Berechnung braucht und zudem auch sehr langsam ist wegen der enormen Menge an Daten. |
Draft for the map/intermediate layer can be found here Still a work in progress but feedback is very appreciated |
I think you have designed a great draft. Before you start your implementation, I recommend conducting ROS-specific research to identify elements that could enhance your architecture. This doesn't mean you should use only existing ROS Noetic features, but they can provide helpful inspiration, and you might find pre-existing solutions. Examples
Try to find 2 or 3 team members for feedback because design decisions now are critical. |
Props to you for the detailed investigation into the topic. There is loads of information in the Document provided. I suggest to start a similar draw.io project as to our mindmap in order to efficiently communicate the map representation as a UML-class diagram and the data flow chart as a modifieable entity. One aspect I couldn't find in the document was, that there is currently no Entity in the definition which could represent lane markings. Maybe there should be some sort of Line entity, this could also get used for e.g. the merging of Lidar points, or for entities of which we don't know the depth (row of houses, a wall etc). Regarding TF2: Using tf2 has a big advantage in my opinion: Considering this, a very important aspect is to find a suitable ROS-like way to propagate the information to users of the map. A service like structure (users can query the information at a mapping server) is probably sufficient if there is a limited amount of users. A purely topic based system would require the user to store the data and use it when necessary, which could result in outdated data. A tf2 like buffering system sound promising but is probably tough to implement. As mentioned in the beginning there is probably already more information in the document than can be discussed in comments on this Issue. Feel free to arrange a meeting with interested members to further discuss entity structures, map propagation etc. |
Thanks for reading and for the feedback of the draft. For further discussion I will be available on Monday from 13:00 until 15:30. I agree that a lot of stuff still has to be worked out until we can start the implementation. |
Detailed Description
Brainstorm and compare intermediate layer representations.
Base and research for #486
Definition of Done
Documentation exists about:
Effort Estimate
Open end
Testability
No response
Dependencies
No response
The text was updated successfully, but these errors were encountered: