145 KiB
Coding Interview University
- Versión original: Inglés
Originalmente creé esto como una lista corta de tópicos a estudiar para volverse un Ingeniero de Software, pero creció hasta ser la gran lista puede apreciar actualmente. Después de pasar por este plan de estudios ¡fui contratado como Ingeniero de Desarrollo de Software en Amazon!
Posiblemente no tenga que estudiar mucho como yo. De cualquier forma todo lo que necesita esta aquí.
Los elementos listados aquí le prepararan bien para una entrevista en cualquier compañía de software, incluyendo a los gigantes: Amazon, Facebook, Google o Microsoft.
¡La mejor de las suertes!
Traducciones:
- 中文版本
- Tiếng Việt - Vietnamese
- translations in progress:
¿Qué es esto?
Este es mi plan de estudios de varios meses para pasar de ser un Desarrollador Web (Autodidacta, sin título) a un Ingeniero de Software para una gran compañía.
Esto es para los nuevos Ingenieros de Software o aquellos que quieren cambiar del Desarrollo de Software/Web a Ingeniero de Software (Donde el conocimiento de las Ciencias de Computación es requerido). Si tiene varios años de experiencia y clama tenerlos como Ingeniero de Software, espere una entrevista más ardua.
Si tiene varios años de experiencia en desarrollo de software/web note que las grandes compañías como Google, Amazon, Facebook y Microsoft ven la Ingeniería de Software diferente al Desarrollo de Software/Web, requiriendo del conocimiento de las Ciencias de Computación.
Si desea ser un Ingeniero de Escalabilidad/Seguridad o un Ingeniero de Sistemas, estudie más de la lista opcional (Redes, Seguridad).
Tabla de contenido
- ¿Qué es esto?
- ¿Por qué usarlo?
- Como usarlo
- No sienta no es lo suficientemente listo
- Acerca de los recursos de vídeo
- Prepárese para la entrevista
- Escoja un lenguaje para la entrevista
- Lista de libros
- Antes de iniciar
- Lo que no verá cubierto
- El plan diario
- Conocimientos Previos
- Complejidad algorítmica / Big-O / Análisis asintótico
- Estructuras de datos
- Información adicional
- Árboles
- Árboles - Notas & Antecedentes
- Árboles de búsqueda binaria: BSTs
- Montículo / Colas de Prioridad / Montículo binario
- Árboles de búsqueda balanceables (Concepto General, sin detallar)
- Recorridos: preorder, inorder, postorder, BFS, DFS
- Ordenamientos
- Selección
- Inserción
- Por montículos (heapsort)
- Rápido (quicksort)
- Por mezcla (merge sort)
- Grafos
- Dirigidos
- No dirigidos
- Matriz de adyacencia
- Lista de adyacencia
- Recorridos: BFS, DFS
- Más información adicional
- Recursión
- Programación Dinámica
- Programación Orientada a Objetos
- Patrones de diseño
- Combinatorias (n elije k) & Probabilidad
- NP, NP-Completo y Algoritmos de aproximación
- Memoria cache
- Procesos e hilos
- Documentos
- Pruebas
- Planificador
- Implementar rutinas del sistema
- Búsqueda de cadenas y manipulaciones
- Tries
- Números de punto flotante
- Unicode
- Extremidad (Endianness)
- Redes
- Diseño del Sistema, Escalabilidad, Manejo de Datos (Si tiene más de 4 años de experiencia)
- Practica de preguntas de codificación
- Ejercicios de codificación/Desafíos
- Una vez cerca de la entrevista
- Su CV
- Pensando en cuando llegue la entrevista
- Preguntas para el entrevistador
- Una vez obtenido el empleo
---------------- Todo debajo de esta marca es opcional ----------------
- Libros adicionales
- Aprendizaje adicional
- Compiladores
- Emacs y Vi(m)
- Unix: Herramientas para la línea de comandos
- Teoría de la información
- Código de paridad y Hamming
- Entropía
- Criptografía
- Compresión
- Seguridad informática
- Garbage collection
- Programación en paralelo
- Sistemas de mensajería, serialización y colas
- A*
- Transformada rápida de Fourier
- Filtro de Bloom
- HyperLogLog
- Hashing sensible a la localidad
- Árboles van Emde Boa
- Estructuras de datos aumentadas
- Árboles N-avo (K-avo, M-avo)
- Árboles de búsqueda equilibrada
- Árboles AVL
- Árboles biselados
- Árboles rojos/negros
- Árboles de búsqueda 2-3
- Árboles 2-3-4 (aka Árboles 2-4)
- Árboles N-avo (K-avo, M-avo)
- Árboles-B
- Árboles k-D
- Lista por saltos
- Flujos de red
- Conjuntos disjuntos & Encontrar unión
- Matemáticas para procesamiento rápido
- Treap
- Programación Lineal
- Geometría, casco convexo
- Matemáticas discretas
- Aprendizaje automático
- Detalles adicionales de ciertos temas
- Series de videos
- Cursos de Informática
¿Por qué usarlo?
Cuando comencé este proyecto, no sabía la diferencia entre un stack y un heap, no conocía la notación Big-O, nada acerca de árboles, ni cómo sacar la transversal de una gráfica. Si tenía que programar un algoritmo de clasificación, puedo decir que no hubiera sido muy bueno. Cada estructura de datos que había utilizado estaba incorporada al lenguaje, y yo no sabía cómo funcionaban realmente. Yo nunca tuve que manejar la memoria a menos que un proceso que yo estaba corriendo diera un error de “out of memory”, y tenía que encontrar una alternativa. He usado pocos arreglos de varias dimensiones en mi vida y miles de arreglos asociativos, pero nunca he creado estructuras de datos desde cero.
Pero después de pasar por todo este plan de estudios tengo mucha confianza de que seré contratado. Me toará meses. Si mucho de esto te resulta familiar entonces te tomará mucho menos tiempo.
Es un plan largo, puede tome unos meses; pero si le resulta familiar mucho de esto le tomara mucho menos tiempo.
Como usarlo
Todo lo que aparece abajo es un plan, y debería abordar los elementos en orden de arriba a abajo.
Estoy usando el tema especial de markdown de Github, incluyendo listas de tareas para comprobar el progreso.
[] Cree una nueva rama para que pueda validar elementos como este, solo ponga una x en los corchetes: [x]
Haga fork a una rama y siga los comandos siguientes
git checkout -b progress
git remote add jwasham https://github.com/jwasham/coding-interview-university
git fetch --all
Marque todas las cajas con una x después de que completa los cambios
git add .
git commit -m "Marked x"
git rebase jwasham/master
git push --force
Más acerca de los temas de Github para markdown
No sienta no es lo suficientemente listo
- Los ingenieros de software exitosos son inteligentes pero muchos tienen la inseguridad de no ser lo suficientemente listos.
- The myth of the Genius Programmer
- It's Dangerous to Go Alone: Battling the Invisible Monsters in Tech
Acerca de los recursos de vídeo
Algunos videos solo están disponibles inscribiéndose a una clase de Coursera, EdX, o Lynda.com. Estos son llamados MOOCs. En ocasiones las clases no están en sesión por lo que tendrá que esperar un par de meses, por lo que no tiene acceso. Los cursos de Lynda.com no son gratuitos.
Apreciaría su ayuda añadiendo fuentes siempre disponibles, publicas y gratuitas como videos de Youtube para acompañar a los videos del curso en línea.
Me gustan recursos provenientes de universidades.
Prepárese para la entrevista
-
Cracking The Coding Interview Set 1:
-
How to Get a Job at the Big 4:
-
Prep Course:
- Software Engineer Interview Unleashed (paid course):
- Aprenda como alistarse para una entrevista de Ingeniería de Software con un entrevistador de Google.
- Python for Data Structures, Algorithms, and Interviews! (paid course):
- Un curso enfocado a una entrevista centrada en Python; que cubre estructuras de datos, algoritmos, plantillas de entrevistas y mucho más.
- Software Engineer Interview Unleashed (paid course):
Escoja un lenguaje para la entrevista
Puede usar un lenguaje con el que este cómodo para hacer la parte de código para la entrevista, pero para las grandes compañías, estas son buenas elecciones:
- C++
- Java
- Python
También podrías usar éstos, pero busca información primero. Puede haber advertencias:
- JavaScript
- Ruby
Debes sentirte muy cómodo con el lenguaje y ser experto.
Lee más acerca de opciones:
- http://www.byte-by-byte.com/choose-the-right-language-for-your-coding-interview/
- http://blog.codingforinterviews.com/best-programming-language-jobs/
Verás algunos materiales de aprendizaje de C, C++ y Python abajo, porque estoy aprendiendo. Hay algunos libros involucrados, ve al final.
Lista de libros
Ésta es una lista más corta que la que yo usé. Está abreviada para ahorrarle tiempo.
Preparación para la entrevista
- Programming Interviews Exposed: Secrets to Landing Your Next Job, 2nd Edition
- Respuestas en C++ y Java
- Este es un buen calentamiento para Cracking the Coding Interview
- No muy difícil, muchos problemas pueden ser más sencillos de los que verá en la entrevista (Por lo que he leído)
- Cracking the Coding Interview, 6th Edition
- Respuestas en Java
Si tiene mucho tiempo extra:
- Elements of Programming Interviews (C++ version)
- Elements of Programming Interviews (Java version)
Arquitectura de Computadores
Si esta corto de tiempo:
- Write Great Code: Volume 1: Understanding the Machine
- El libro fue publicado en 2004, y es algo anticuado pero es un recurso fantástico para la comprensión de una computadora en breve.
- El autor inventó HLA, por lo que tiene muchas menciones y ejemplos en HLA. No es ampliamente utilizado, pero los ejemplos son decentes para ver cómo es un lenguaje ensamblador.
- Estos capítulos valen la pena ser leídos para brindarle una buena base:
- Chapter 2 - Numeric Representation
- Chapter 3 - Binary Arithmetic and Bit Operations
- Chapter 4 - Floating-Point Representation
- Chapter 5 - Character Representation
- Chapter 6 - Memory Organization and Access
- Chapter 7 - Composite Data Types and Memory Objects
- Chapter 9 - CPU Architecture
- Chapter 10 - Instruction Set Architecture
- Chapter 11 - Memory Architecture and Organization
Si tiene más tiempo (Yo quiero este libro):
- Computer Architecture, Fifth Edition: A Quantitative Approach
- Para un tratamiento más rico y actualizado (2011), pero un trato más largo.
Específicos del lenguaje
Necesita escoger un lenguaje para la entrevista (mire arriba). Aquí están mis recomendaciones por lenguaje. No tengo recursos para todos los lenguajes. Son bienvenidas adiciones.
Si ha leído alguno de estos, probablemente tenga todos los conocimientos de estructuras de datos y algoritmos que necesitara para hacer problemas de codificación. Puede saltarse todas las video-lecturas en este proyecto, a menos que quiera una crítica.
Recursos adicionales específicos del lenguaje aquí.
C++
No he leído estos dos, pero están altamente calificados y escritos por Sedgewick. Él es asombroso.
- Algorithms in C++, Parts 1-4: Fundamentals, Data Structure, Sorting, Searching
- Algorithms in C++ Part 5: Graph Algorithms
Si tiene una mejor recomendación para C++ por favor hágamelo saber. Busco fuentes comprensivas.
Java
- Algorithms (Sedgewick and Wayne)
- videos with book content (and Sedgewick!):
O:
- Data Structures and Algorithms in Java
- Por Goodrich, Tamassia, Goldwasser
- Usado como texto opcional en el curso de Informática impartido en UC Berkeley
- Vea mi reporte de la versión de Python debajo. Este libro abarca los mismos tópicos.
Python
- Data Structures and Algorithms in Python
- Por Goodrich, Tamassia, Goldwasser
- Ame este libro. Cubre todo y más.
- Código Pythonioco
- Mi brillante reporte del libro : https://startupnextdoor.com/book-report-data-structures-and-algorithms-in-python/
Libros Opcionales
Algunas personas recomiendan estos pero creo exageran, a menos que tenga muchos años de experiencia en Ingeniería de Software y espere una entrevista mucho más difícil:
-
Algorithm Design Manual (Skiena)
- Como un resumen y un reconocimiento de problemas
- La porción del catálogo de algoritmos está más allá del alcance de la dificultad que obtendrá en una entrevista.
- Este libro consta de dos partes:
- Libro de clase sobre estrcutura de datos y algoritmos
- Pros:
- Es un buen resumen como cualquier libro de algoritmos debe ser
- Buenas historias de sus experiencias resolviendo problemas en la industria y en la academia
- Ejemplos codificados en C
- Cons:
- Puede ser así de denso o impenetrable como los CLRS, en algunos casos, los CLRS pueden proveer una mejor alternativa para algunos temas
- Capítulos 7, 8, 9 pueden ser un martirio intentar darles seguimiento, ya que no están bien explicados o requieren más cerebro del que tengo
- No me malentiendan: Me gusta Skiena, su estilo de enseñanza y manierismos, pero no puedo ser material de Stony Brook.
- Pros:
- Catálogo de algoritmos:
- Es la verdadera razón para comprar el libro.
- Actualizare esto, una vez haya pasado por este.
- Libro de clase sobre estrcutura de datos y algoritmos
- Se puede rentar en Kindle
- Half.com es un gran recurso para libros de textos a buen precio.
- Respuestas:
- Errata
-
- Importante: Leer este libro tendrá un valor limitado. Este libro es un buen resumen de algoritmos y estructuras de datos, pero no le enseñará como escribir un buen código. Necesita ser capaz de codificar una solución decente eficientemente.
- Half.com es un buen recurso para libros a buenos precios.
- Aka CLR, a veces CLRS, porque Stein llego tarde al juego
-
- El primer par de capítulos presentan soluciones inteligentes a problemas de programación (algunos muy antiguos con cinta de datos) pero solo es una introducción. Esta es una guía sobre el diseño y la arquitectura del programa, como Code Complete, pero mucho más corto.
-
"Algorithms and Programming: Problems and Solutions" by Shen- Un buen libro, pero después de trabajar con algunos problemas me fruste con Pascal, ciclos do while, 1-arreglos indexados y resultados poco claros de satisfacción post-condición.
- Prefiero pasar tiempo en problemas de codificación de otro libro o problemas de codificación en línea.
Antes de iniciar
Esta lista creció a lo largo de varios meses, y sí, está un poco fuera de las manos.
Aquí algunos de mis errores para que pueda tener una mejor experiencia.
1. No recordará todo
Vi horas de video y tomé notas exactas de ellos, meses después había mucho que no recordaba. Pase tres días entre mis notas y haciendo tarjetas para poder repasar. .
Lea por favor para que no cometa mis errores:
Retaining Computer Science Knowledge
2. Use tarjetas para recordar
Para solucionar el problema construí un pequeño sitio de tarjetas para recordar donde podía añadir tarjetas de dos tipos: general y código. Cada tarjeta tiene distinto formato.
Hice un sitio adaptado a moviles para revisarlo en mi celular y en mi Tablet, donde quiera estuviera.
Haga el suyo gratis:
- Flashcards site repo
- My flash cards database (old - 1200 cards):
- My flash cards database (new - 1800 cards):
Tenga en cuenta que empecé desde abajo y hay tarjetas que cubren todo, desde el lenguaje ensamblador y la trivia Python al Machine Learning y estadísticas. Es demasiado para lo que se requiere.
Nota en las tarjetas: La primera vez reconozca sabe la respuesta, no marque como conocido; necesita contestar muchas veces correctamente antes de que en realidad lo sepa. La repetición pondrá ese conocimiento de forma más profunda en su cerebro.
Una alternativa a usar mi sitio de tarjetas es Anki, que me ha sido recomendado muchas veces. Usa un sistema de repetición para ayudarle a recordar. Es amigable con el usuario y disponible para todas las plataformas y tiene un sistema de sincronización en la nube. Cuesta $25 en iOS pero es gratuito en las otras plataformas.
Mis tarjetas en ek formato de Anki: https://ankiweb.net/shared/info/25173560 (Gracias@xiewenya)
3. Revise, revise, revise
Mantuve una serie de hojas clave en ASCII, OSI stack, notación Big-O y más. Las estudie cuando tenía tiempo libre.
Tome un descanso de los problemas de programación por media hora y repase sus tarjetas.
4. Enfóquese
Hay muchas distracciones le pueden quitar tiempo valioso. Enfocarse y concentrarse es difícil.
Lo que no verá cubierto
Estas son tecnologías predominantes, pero no están cubiertas por este plan de estudios:
- SQL
- Javascript
- HTML, CSS, y otras tecnologías front-end
El plan diario
Algunos temas tomarán un día y otros tomarán varios. Algunos son solo para aprender sin nada que implementar.
Cada día yo tomé un tema de los siguientes, vi videos sobre el tema y escribía una implementación:
- C - usando estructuras y funciones que toman una estructura * y otra cosa como argumentos.
- C++ - sin utilizar tipos incorporados
- C++ - usando tipos incorporados, como std::list de STL para una lista enlazada
- Python - usando tipos incorporados (para seguir practicando Python)
- y escribir pruebas para asegurarme de que lo estoy haciendo bien, a veces simplemente usando simples declaraciones assert()
- Puede hacer Java o algo más, esto es solo lo mío.
No necesita todo esto. Solo necesita un lenguaje para la entrevista.
¿Por qué codificar en todo esto?
- Práctica, práctica, práctica… hasta que me canse de ello y pueda hacerlo sin ningún problema (algunos usan técnicas y marcadores para recordar)
- Trabajar dentro de las restricciones primarias (asignar / liberar memoria sin ayuda del garbage collection (excepto Python))
- Hacer uso de los tipos incorporados para que tenga experiencia usando las herramientas de tipos incorporados para su uso en el mundo real (no escribiré mi propia implementación de listas enlazadas en producción)
Puede que no tenga tiempo de hacer todo esto para cada tema, pero lo intentare.
Puede ver mi código aquí:
No es necesario recordar las entrañas de cada algoritmo.
Escriba código en un pizarrón o en papel no en la computadora. Pruebe con alguna entrada de prueba. Después pruébelos en la computadora.
Conocimientos Previos
-
Aprenda C
- C esta en todos lados. Verá ejemplos en libros, lecturas, videos, en todo lugar mientras esté estudiando.
- C Programming Language, Vol 2
- Este es un libro corto, pero le dará un gran manejo en el lenguaje C y si lo practica un poco, rápidamente conseguirá ser experto. Comprender C le ayuda a entender cómo funcionan los programas y la memoria.
- answers to questions
-
Como las computadoras procesan un programa:
Complejidad algorítmica / Big-O / Análisis asintótico
-
Nada a implementar
-
Big O Notation (and Omega and Theta) - best mathematical explanation (video)
-
Skiena:
-
TopCoder (includes recurrence relations and master theorem):
-
Si algunas de las lecturas son muy matemáticas puede saltar a la parte inferior y ver las matemáticas discretas para tener el conocimiento base.
Estructuras de datos
-
Arreglos
- Implemente un vector automáticamente redimensionable.
- Descripción:
- Implemente un vector (Arreglo mutable con redimensionamiento automático):
- Practique codificar usando arreglos y apuntadores, y un apuntador matemático para saltar a un índice en lugar de utilizar la indexación.
- Nueva arreglo de información primaria con memoria asignada
- Puede asignar un arreglo entero, simplemente no use sus características
- Empiece con 16, o si el número inicial es mayor, use potencias del 2 - 16, 32, 64, 128
- size() – Número de elementos
- capacity() – Número de elementos soportados
- is_empty()
- at(index) – Regresa el elemento al índice dado, falla si el índice esta fuera de sus limites
- push(item)
- insert(index, item) – Inserta el elemento en el índice, intercambia el valor del índice y desplaza los elementos a la derecha
- prepend(item) – Puede usar para insertar encima del índice 0
- pop() – Elimina del final, regresa el valor
- delete(index) – Elimina el elemento en el índice, intercambia todos desplazándolos a la izquierda
- remove(item) – Busca el valor y elimina el índice lo contiene(aunque este en varios lugares)
- find(item) – Busca el valor y regresa el primer índice con ese valor, -1 si no encuentra
- resize(Nueva capacidad) // Función privada
- Cuando alcance el límite, redimensiona al doble el tamaño
- Cuando se haga “pop” a un elemento, si el tamaño es 1/4 de la capacidad, redimensiona a la mitad
- Tiempo
- O(1) Para añadir/eliminar al final (Amortizado para asignaciones por más espacio), índice o actualización
- O(n) Para insertar/eliminar donde sea
- Espacio
- Contiguo en la memoria, por lo que la proximidad ayuda al rendimiento
- Espacio necesario = (capacidad de matriz, que es> = n) * tamaño del elemento, pero incluso si 2n, todavía O (n))
-
Listas Enlazadas
- Descripción:
- C Code (video) - No todo el video, solo porciones acerca de la estructura de nodos y la asignación de memoria.
- Listas enlazadas vs Arreglos:
- why you should avoid linked lists (video)
- Gotcha: Necesita tener conocimiento del apuntador a apuntador: (Cuando se pasa un apuntador a una función este puede cambiar la dirección a la que el apuntador apunta) Esta página es sólo para tener una idea sobre un apuntador a un apuntador. No recomiendo esta lista de estilo transversal. La legibilidad y sostenibilidad sufren debido a la astucia.
- Implemente (Lo hice con y sin un puntero de cola):
- size() – Regresa el número de elementos en la lista
- empty() – Un bool que regresa verdadero si está vacío
- value_at(index) – Regresa el valor del el n-avo elemento (iniciando con el 0 como primero)
- push_front(value) – Añade un elemento al frente de la lista
- pop_front() – Elimina el elemento frontal y regresa su valor
- push_back(value) – Añade un elemento al final
- pop_back() – Elimina el último elemento y devuelve su valor
- front() – Obtiene el valor del elemento frontal
- back() – Obtiene el valor del último elemento
- insert(index, value) – Inserta valor en el índice, por lo que el valor actual en ese índice es apuntado al nuevo elemento en el índice
- erase(index) – Borra el nodo del índice dado
- value_n_from_end(n) – Regresa el valor del nodo en la n-ava posición a partir del final de la lista
- reverse() – Pone al revés toda la lista
- remove_value(value) – Borra el primer elemento en la lista con ese valor
- Doble lista enlazada
- Description (video)
- No es necesario
-
Pila
- Stacks (video)
- Using Stacks Last-In First-Out (video)
- No implementaré. Implementando con arreglos es trivial.
-
Cola o fila
- Using Queues First-In First-Out(video)
- Queue (video)
- Circular buffer/FIFO
- Priority Queues (video)
- Implementar usando listas enlazadas, con el puntero de la cola:
- enqueue(value) – Añade el valor en la posición de la cola
- dequeue() – Regresa el valor y elimina el valor más recientemente añadido(frontal)
- empty()
- Implementar usando arreglos de tamaño fijo:
- enqueue(value) – Añade elemento al final del almacenamiento disponible
- dequeue() – Regresa el valor y elimina el elemento más recientemente añadido
- empty()
- full()
- Costo:
- Una mala implementación usando lista enlazada donde se enqueue en la cabeza y dequeue en la cola sería O (n) Porque usted necesitaría el siguiente al último elemento, causando un recorrido completo cada dequeue
- enqueue: O(1) (amortizado, Lista enlazada y arreglo [sondaje])
- dequeue: O(1) (Lista enlazada y arreglo)
- empty: O(1) (Lista enlazada y arreglo)
-
Matriz asociativa
-
Videos:
-
Cursos en línea:
-
Implementar con arreglo usando sondaje lineal
- hash(k, m) - m es el tamaño de la matriz asociativa
- add(key, value) – Si la llave ya existe , actualiza el valor
- exists(key)
- get(key)
- remove(key)
-
Información adicional
-
Búsqueda binaria
- Binary Search (video)
- Binary Search (video)
- detail
- Implementar:
- Búsqueda binaria (en un arreglo ordenado de enteros)
- Búsqueda binaria usando recursión
-
Operaciones bit a bit
- Bits cheat sheet - Debería conocer varias de las potencias de 2 a partir de (2^1 to 2^16 and 2^32)
- Obtenga un buen entendimiento de la manipulación de bits con: &, |, ^, ~, >>, <<
- 2s and 1s complement
- count set bits
- round to next power of 2:
- swap values:
- absolute value:
Árboles
-
Árboles - Notas & Antecedentes
- Series: Core Trees (video)
- Series: Trees (video)
- Construcción básica de árboles
- Recorrido
- Algoritmos de manipulación
- BFS (búsqueda en amplitud)
- MIT (video)
- Orden de nivel (BFS, usando colas) Tiempo de complejidad: O(n) Espacio de complejidad: Mejor: O(1), Peor: O(n/2)=O(n)
- DFS (búsqueda en profundidad)
- MIT (video)
- Notas: Tiempo de complejidad: O(n) Espacio de complejidad: Mejor: O(log n) – Promedio de la altura del árbol Peor: O(n)
- inorder (DFS: left, self, right)
- postorder (DFS: left, right, self)
- preorder (DFS: self, left, right)
-
Árboles de búsqueda binaria: BSTs
- Binary Search Tree Review (video)
- Series (video)
- Comienza con la tabla de símbolos y pasa por las aplicaciones BST
- Introduction (video)
- MIT (video)
- C/C++:
- Binary search tree - Implementation in C/C++ (video)
- BST implementation - memory allocation in stack and heap (video)
- Find min and max element in a binary search tree (video)
- Find height of a binary tree (video)
- Binary tree traversal - breadth-first and depth-first strategies (video)
- Binary tree: Level Order Traversal (video)
- Binary tree traversal: Preorder, Inorder, Postorder (video)
- Check if a binary tree is binary search tree or not (video)
- Delete a node from Binary Search Tree (video)
- Inorder Successor in a binary search tree (video)
- Implementar:
- insert // Inserta valores en el árbol
- get_node_count // Obtener la cuenta de los valores almacenados
- print_values // Imprime los valores en el árbol, del min al max
- delete_tree
- is_in_tree // Devuelve verdadero si el valor dado existe en el árbol
- get_height // Regresa la altura en los nodos (La altura de cada nodo es 1)
- get_min // Regresa el valor mínimo almacenado en el árbol
- get_max // Regresa el valor máximo almacenado en el árbol
- is_binary_search_tree
- delete_value
- get_successor // Regresa el siguiente valor más alto en el árbol después del valor dado,-1 si ninguno
-
Montículo / Colas de Prioridad / Montículo binario
- Visto como un árbol, pero usualmente es lineal en el almacenamiento (arreglo, lista enlazada)
- Heap
- Introduction (video)
- Naive Implementations (video)
- Binary Trees (video)
- Tree Height Remark (video)
- Basic Operations (video)
- Complete Binary Trees (video)
- Pseudocode (video)
- Heap Sort - jumps to start (video)
- Heap Sort (video)
- Building a heap (video)
- MIT: Heaps and Heap Sort (video)
- CS 61B Lecture 24: Priority Queues (video)
- Linear Time BuildHeap (max-heap)
- Implementar una cola máxima:
- insert
- sift_up – Necesario para el insert
- get_max – Regresa el máximo elemento, sin eliminarlo
- get_size() – Regresa el número de elementos almacenados
- is_empty() – Devuelve verdadero si la cola está vacía
- extract_max – Regresa el máximo elemento, eliminándolo
- sift_down – Necesario para extract_max
- remove(i) – Elimina el elemento en el índice x
- heapify – Crea una cola de un arreglo de elementos, necesario para heap_sort
- heap_sort() – Toma un arreglo no ordenado y lo convierte en un arreglo ordenando en su lugar usando una cola máxima
- Nota: Usar una cola mínima reduciría operaciones, pero duplicaría el espacio necesario (No se puede hacer en lugar).
Ordenamientos
-
Notas:
- Implementar ordenamientos y conocer el mejor/peor de los casos y el promedio de complejidad de cada uno:
- No ordenamiento de burbuja - Es terrible - O(n^2), excepto cuando n <= 16
- Estabilidad en algoritmos de ordenamiento("¿Es Quicksort estable?")
- ¿Cuáles algoritmos pueden ser usados en listas enlazadas? ¿Cuáles en arreglos? ¿Cuál en ambos?
- No recomendaría ordenar una lista enlazada, pero el ordenamiento por mezcla es realizable.
- Merge Sort For Linked List
- Implementar ordenamientos y conocer el mejor/peor de los casos y el promedio de complejidad de cada uno:
-
Para ordenamientos por montículos, vea la estructura de datos de Colas o filas arriba. El ordenamiento por montículos es estupendo, pero inestable.
-
UC Berkeley:
-
Codificando Merge sort:
-
Codificando Quick sort:
-
Implemente:
- Mergesort: O(n log n) Promedio y peor caso
- Quicksort O(n log n) Caso promedio
- El ordenamiento por selección y el de inserción ambos son O(n^2) Promedio y peor caso
- Para ordenamientos por montículos, vea la estructura de datos de Colas o filas arriba.
-
No requeridos, pero los recomendaría:
Como resumen aquí esta una representación visual de 15 algoritmos de ordenamiento. Si necesita más detalle de este tema vea “Ordenamientos” en Detalles adicionales de ciertos temas
Grafos
Los grafos pueden ser usados para representar muchos problemas en las Ciencias de la Computación, así que es una sección larga, como lo son los árboles y ordenamientos.
-
Notas:
- Hay cuatro formas básicas de representar un grafo en memoria:
- Objetos y apuntadores
- Matriz adyacente
- Lista adyacente
- Mapa adyacente
- Familiarícese con cada representación y sus pros y contras
- BFS and DFS – Conozca su complejidad computacional, sus tradeoffs y cómo implementarlos en código real
- Cuando se le haga una pregunta busqué una solución basada en grafos, si no encuentra continúe.
- Hay cuatro formas básicas de representar un grafo en memoria:
-
Lecturas de Skiena – Gran introducción):
- CSE373 2012 - Lecture 11 - Graph Data Structures (video)
- CSE373 2012 - Lecture 12 - Breadth-First Search (video)
- CSE373 2012 - Lecture 13 - Graph Algorithms (video)
- CSE373 2012 - Lecture 14 - Graph Algorithms (con't) (video)
- CSE373 2012 - Lecture 15 - Graph Algorithms (con't 2) (video)
- CSE373 2012 - Lecture 16 - Graph Algorithms (con't 3) (video)
-
Grafos (revisión y más):
- 6.006 Single-Source Shortest Paths Problem (video)
- 6.006 Dijkstra (video)
- 6.006 Bellman-Ford (video)
- 6.006 Speeding Up Dijkstra (video)
- Aduni: Graph Algorithms I - Topological Sorting, Minimum Spanning Trees, Prim's Algorithm - Lecture 6 (video)
- Aduni: Graph Algorithms II - DFS, BFS, Kruskal's Algorithm, Union Find Data Structure - Lecture 7 (video)
- Aduni: Graph Algorithms III: Shortest Path - Lecture 8 (video)
- Aduni: Graph Alg. IV: Intro to geometric algorithms - Lecture 9 (video)
- CS 61B 2014 (starting at 58:09) (video)
- CS 61B 2014: Weighted graphs (video)
- Greedy Algorithms: Minimum Spanning Tree (video)
- Strongly Connected Components Kosaraju's Algorithm Graph Algorithm (video)
-
Curso Completo de Coursera:
-
Implementaré:
- DFS con lista de adyacencia (recursión)
- DFS con la lista de adyacencia (iterativa con la pila)
- DFS con matriz de adyacencia (recursión)
- DFS con matriz de adyacencia (iterativa con pila)
- BFS con lista de adyacencia
- BFS con matriz de adyacencia
- Ruta de acceso de una sola fuente más corta (Dijkstra)
- Árbol de expansión mínimo
- Algoritmos basados en DFS (ver videos de Aduni arriba):
- Comprobar el ciclo (necesario para el tipo topológico, ya que vamos a comprobar el ciclo antes de comenzar)
- Clasificación topológica
- Cuenta los componentes conectados en un grafo
- Lista de componentes fuertemente conectados
- Verificación de grafo bipartito Obtendrá más práctica de grafos en el libro de Skiena (vea Sección de libros debajo) y en los libros de entrevistas
Más información adicional
-
Recursión
- Stanford lectures on recursion & backtracking:
- when it is appropriate to use it
- how is tail recursion better than not?
-
Programación Dinámica
- Este tema puede ser bastante difícil, ya que cada problema soluble PD debe definirse como una relación de recursión, y llegar a ella puede ser complicado.
- Sugiero que busque muchos ejemplos de problemas de PD hasta que tenga una comprensión sólida del patrón involucrado.
- Videos:
- Los videos de Skiena pueden ser duros de seguir ya que a veces usa el pizarrón que es demasiado pequeño para ver
- Skiena: CSE373 2012 - Lecture 19 - Introduction to Dynamic Programming (video)
- Skiena: CSE373 2012 - Lecture 20 - Edit Distance (video)
- Skiena: CSE373 2012 - Lecture 21 - Dynamic Programming Examples (video)
- Skiena: CSE373 2012 - Lecture 22 - Applications of Dynamic Programming (video)
- Simonson: Dynamic Programming 0 (starts at 59:18) (video)
- Simonson: Dynamic Programming I - Lecture 11 (video)
- Simonson: Dynamic programming II - Lecture 12 (video)
- Lista de problemas individuales de PD (cada uno es corto): Dynamic Programming (video)
- Yale Lecture notes:
- Coursera:
-
Programación Orientada a Objetos
- Optional: UML 2.0 Series (video)
- Object-Oriented Software Engineering: Software Dev Using UML and Java (21 videos):
- Puede omitir esto si tiene una gran comprensión de OO y OO prácticas de diseño.
- OOSE: Software Dev Using UML and Java
- SOLID OOP Principles:
- Bob Martin SOLID Principles of Object Oriented and Agile Design (video)
- SOLID Principles (video)
- S - Single Responsibility Principle | Single responsibility to each Object
- O - Open/Closed Principal | On production level Objects are ready for extension but not for modification
- L - Liskov Substitution Principal | Base Class and Derived class follow ‘IS A’ principal
- I - Interface segregation principle | clients should not be forced to implement interfaces they don't use
- D -Dependency Inversion principle | Reduce the dependency In composition of objects.
-
Patrones de diseño
- Quick UML review (video)
- Aprenda estos patrones:
- strategy
- singleton
- adapter
- prototype
- decorator
- visitor
- factory, abstract factory
- facade
- observer
- proxy
- delegate
- command
- state
- memento
- iterator
- composite
- flyweight
- Chapter 6 (Part 1) - Patterns (video)
- Chapter 6 (Part 2) - Abstraction-Occurrence, General Hierarchy, Player-Role, Singleton, Observer, Delegation (video)
- Chapter 6 (Part 3) - Adapter, Facade, Immutable, Read-Only Interface, Proxy (video)
- Series of videos (27 videos)
- Head First Design Patterns
- I know the canonical book is "Design Patterns: Elements of Reusable Object-Oriented Software", but Head First is great for beginners to OO.
- Handy reference: 101 Design Patterns & Tips for Developers
- Design patterns for humans
-
Combinatorias (n elije k) & Probabilidad
- Math Skills: How to find Factorial, Permutation and Combination (Choose) (video)
- Make School: Probability (video)
- Make School: More Probability and Markov Chains (video)
- Khan Academy:
- Course layout:
- Just the videos - 41 (each are simple and each are short):
-
NP, NP-Completo y Algoritmos de aproximación
- Conozca acerca de las clases más famosas de problemas de NP-completo, tales como el vendedor ambulante y el problema de la mochila y sea capaz de reconocerlos cuando un entrevistador se los pide disfrazados.
- Conozca que significa NP-completo.
- Computational Complexity (video)
- Simonson:
- Skiena:
- Complexity: P, NP, NP-completeness, Reductions (video)
- Complexity: Approximation Algorithms (video)
- Complexity: Fixed-Parameter Algorithms (video)
- Peter Norvig discute soluciones casi óptimas para el problema del vendedor ambulante:
- Paginas 1048 - 1140 en CLRS si lo tiene.
-
Memoria cache
-
Procesos e hilos
- Computer Science 162 - Operating Systems (25 videos):
- Para los procesos e hilos vea los videos 1-11
- Operating Systems and System Programming (video)
- What Is The Difference Between A Process And A Thread?
- Cubre:
- Procesos, Hilos, Temas de Concurrencia
- Diferencia entre procesos e hilos
- Procesos
- Hilos
- Cerraduras
- Mutexes
- Semáforos
- Monitores
- Cómo trabajan ellos
- Bloqueo
- Livelock
- Actividad de CPU, interrupciones, conmutación de contexto
- Moderna concurrencia construida con procesadores multinúcleo
- Paging, segmentation and virtual memory (video)
- Interrupts (video)
- Scheduling (video)
- Necesidades de recursos de proceso (memoria: código, almacenamiento estático, pila, monticulo y también descriptores de archivo, i /o)
- Necesidades de recursos de hilos (partes anteriores (menos pila) con otros hilos en el mismo proceso, pero cada uno tiene su propio PC, contador de pila, registros y pila)
- Bifurcación es realmente copia en escritura (sólo lectura) hasta que el nuevo proceso escribe en memoria, entonces hace una copia completa.
- Cambio de contexto
- Cómo se inicia el cambio de contexto por el sistema operativo y el hardware subyacente
- Procesos, Hilos, Temas de Concurrencia
- threads in C++ (series - 10 videos)
- concurrency in Python (videos):
- Computer Science 162 - Operating Systems (25 videos):
-
Documentos
- La lectura de todos de extremo a extremo con la comprensión completa probablemente tomará más tiempo del que tiene. Recomiendo ser selectivo en los documentos y sus secciones.
- Love classic papers?
- 1978: Communicating Sequential Processes
- 2003: The Google File System
- Remplazado por Colossus en 2012
- 2004: MapReduce: Simplified Data Processing on Large Clusters
- ¿Casi totalmente remplazado por Cloud Dataflow?
- 2006: Bigtable: A Distributed Storage System for Structured Data
- 2006: The Chubby Lock Service for Loosely-Coupled Distributed Systems
- 2007: Dynamo: Amazon’s Highly Available Key-value Store
- The Dynamo paper kicked off the NoSQL revolution
- 2007: What Every Programmer Should Know About Memory (very long, and the author encourages skipping of some sections)
- 2010: Dapper, a Large-Scale Distributed Systems Tracing Infrastructure
- 2010: Dremel: Interactive Analysis of Web-Scale Datasets
- 2012: Google's Colossus
- paper not available
- 2012: AddressSanitizer: A Fast Address Sanity Checker:
- 2013: Spanner: Google’s Globally-Distributed Database:
- 2014: Machine Learning: The High-Interest Credit Card of Technical Debt
- 2015: Continuous Pipelines at Google
- 2015: High-Availability at Massive Scale: Building Google’s Data Infrastructure for Ads
- 2015: TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems
- 2015: How Developers Search for Code: A Case Study
- 2016: Borg, Omega, and Kubernetes
-
Pruebas
- A cubrir:
- Cómo funciona la prueba unitaria
- ¿Qué son objetos simulados?
- ¿Qué es la prueba de integración?
- ¿Qué es la inyección de dependencia?
- Agile Software Testing with James Bach (video)
- Open Lecture by James Bach on Software Testing (video)
- Steve Freeman - Test-Driven Development (that’s not what we meant) (video)
- TDD is dead. Long live testing.
- Is TDD dead? (video)
- Video series (152 videos) - not all are needed (video)
- Test-Driven Web Development with Python
- Inyección de dependencia:
- How to write tests
- A cubrir:
-
Planificador
- in an OS, how it works
- can be gleaned from Operating System videos
-
Implementar rutinas del sistema
- understand what lies beneath the programming APIs you use
- can you implement them?
-
Búsqueda de cadenas y manipulaciones
- Sedgewick - Suffix Arrays (video)
- Sedgewick - Substring Search (videos)
- Search pattern in text (video)
If you need more detail on this subject, see "String Matching" section in Additional Detail on Some Subjects
-
Tries
- Note there are different kinds of tries. Some have prefixes, some don't, and some use string instead of bits to track the path.
- I read through code, but will not implement.
- Sedgewick - Tries (3 videos)
- Notes on Data Structures and Programming Techniques
- Short course videos:
- The Trie: A Neglected Data Structure
- TopCoder - Using Tries
- Stanford Lecture (real world use case) (video)
- MIT, Advanced Data Structures, Strings (can get pretty obscure about halfway through)
-
Números de punto flotante
-
Unicode
-
Extremidad (Endianness)
- Big And Little Endian
- Big Endian Vs Little Endian (video)
- Big And Little Endian Inside/Out (video)
- Very technical talk for kernel devs. Don't worry if most is over your head.
- The first half is enough.
-
Redes
- Si tiene experiencia en redes o quiere se un Ingeniero en Sistemas espere preguntas
- otherwise, this is just good to know
- Khan Academy
- UDP and TCP: Comparison of Transport Protocols
- TCP/IP and the OSI Model Explained!
- Packet Transmission across the Internet. Networking & TCP/IP tutorial.
- HTTP
- SSL and HTTPS
- SSL/TLS
- HTTP 2.0
- Video Series (21 videos)
- Subnetting Demystified - Part 5 CIDR Notation
- Sockets:
Diseño del Sistema, Escalabilidad, Manejo de Datos
- You can expect system design questions if you have 4+ years of experience.
- Scalability and System Design are very large topics with many topics and resources, since there is a lot to consider when designing a software/hardware system that can scale. Expect to spend quite a bit of time on this.
- Considerations:
- scalability
- Distill large data sets to single values
- Transform one data set to another
- Handling obscenely large amounts of data
- system design
- features sets
- interfaces
- class hierarchies
- designing a system under certain constraints
- simplicity and robustness
- tradeoffs
- performance analysis and optimization
- scalability
- START HERE: The System Design Primer
- System Design from HiredInTech
- How Do I Prepare To Answer Design Questions In A Technical Inverview?
- 8 Things You Need to Know Before a System Design Interview
- Algorithm design
- Database Normalization - 1NF, 2NF, 3NF and 4NF (video)
- System Design Interview - There are a lot of resources in this one. Look through the articles and examples. I put some of them below.
- How to ace a systems design interview
- Numbers Everyone Should Know
- How long does it take to make a context switch?
- Transactions Across Datacenters (video)
- A plain English introduction to CAP Theorem
- Paxos Consensus algorithm:
- Consistent Hashing
- NoSQL Patterns
- Scalability:
- Great overview (video)
- Short series:
- Scalable Web Architecture and Distributed Systems
- Fallacies of Distributed Computing Explained
- Pragmatic Programming Techniques
- Jeff Dean - Building Software Systems At Google and Lessons Learned (video)
- Introduction to Architecting Systems for Scale
- Scaling mobile games to a global audience using App Engine and Cloud Datastore (video)
- How Google Does Planet-Scale Engineering for Planet-Scale Infra (video)
- The Importance of Algorithms
- Sharding
- Scale at Facebook (2009)
- Scale at Facebook (2012), "Building for a Billion Users" (video)
- Engineering for the Long Game - Astrid Atkinson Keynote(video)
- 7 Years Of YouTube Scalability Lessons In 30 Minutes
- How PayPal Scaled To Billions Of Transactions Daily Using Just 8VMs
- How to Remove Duplicates in Large Datasets
- A look inside Etsy's scale and engineering culture with Jon Cowie (video)
- What Led Amazon to its Own Microservices Architecture
- To Compress Or Not To Compress, That Was Uber's Question
- Asyncio Tarantool Queue, Get In The Queue
- When Should Approximate Query Processing Be Used?
- Google's Transition From Single Datacenter, To Failover, To A Native Multihomed Architecture
- Spanner
- Egnyte Architecture: Lessons Learned In Building And Scaling A Multi Petabyte Distributed System
- Machine Learning Driven Programming: A New Programming For A New World
- The Image Optimization Technology That Serves Millions Of Requests Per Day
- A Patreon Architecture Short
- Tinder: How Does One Of The Largest Recommendation Engines Decide Who You'll See Next?
- Design Of A Modern Cache
- Live Video Streaming At Facebook Scale
- A Beginner's Guide To Scaling To 11 Million+ Users On Amazon's AWS
- How Does The Use Of Docker Effect Latency?
- Does AMP Counter An Existential Threat To Google?
- A 360 Degree View Of The Entire Netflix Stack
- Latency Is Everywhere And It Costs You Sales - How To Crush It
- Serverless (very long, just need the gist)
- What Powers Instagram: Hundreds of Instances, Dozens of Technologies
- Cinchcast Architecture - Producing 1,500 Hours Of Audio Every Day
- Justin.Tv's Live Video Broadcasting Architecture
- Playfish's Social Gaming Architecture - 50 Million Monthly Users And Growing
- TripAdvisor Architecture - 40M Visitors, 200M Dynamic Page Views, 30TB Data
- PlentyOfFish Architecture
- Salesforce Architecture - How They Handle 1.3 Billion Transactions A Day
- ESPN's Architecture At Scale - Operating At 100,000 Duh Nuh Nuhs Per Second
- See "Messaging, Serialization, and Queueing Systems" way below for info on some of the technologies that can glue services together
- Twitter:
- For even more, see "Mining Massive Datasets" video series in the Video Series section.
- Practicing the system design process: Here are some ideas to try working through on paper, each with some documentation on how it was handled in the real world:
- review: The System Design Primer
- System Design from HiredInTech
- cheat sheet
- flow:
- Understand the problem and scope:
- define the use cases, with interviewer's help
- suggest additional features
- remove items that interviewer deems out of scope
- assume high availability is required, add as a use case
- Think about constraints:
- ask how many requests per month
- ask how many requests per second (they may volunteer it or make you do the math)
- estimate reads vs. writes percentage
- keep 80/20 rule in mind when estimating
- how much data written per second
- total storage required over 5 years
- how much data read per second
- Abstract design:
- layers (service, data, caching)
- infrastructure: load balancing, messaging
- rough overview of any key algorithm that drives the service
- consider bottlenecks and determine solutions
- Understand the problem and scope:
- Exercises:
Final Review
This section will have shorter videos that you can watch pretty quickly to review most of the important concepts.
It's nice if you want a refresher often.
- Series of 2-3 minutes short subject videos (23 videos)
- Series of 2-5 minutes short subject videos - Michael Sambol (18 videos):
- Sedgewick Videos - Algorithms I
- Sedgewick Videos - Algorithms II
Practica de preguntas de codificación
Now that you know all the computer science topics above, it's time to practice answering coding problems.
Coding question practice is not about memorizing answers to programming problems.
Why you need to practice doing programming problems:
- problem recognition, and where the right data structures and algorithms fit in
- gathering requirements for the problem
- talking your way through the problem like you will in the interview
- coding on a whiteboard or paper, not a computer
- coming up with time and space complexity for your solutions
- testing your solutions
There is a great intro for methodical, communicative problem solving in an interview. You'll get this from the programming interview books, too, but I found this outstanding: Algorithm design canvas
No whiteboard at home? That makes sense. I'm a weirdo and have a big whiteboard. Instead of a whiteboard, pick up a large drawing pad from an art store. You can sit on the couch and practice. This is my "sofa whiteboard". I added the pen in the photo for scale. If you use a pen, you'll wish you could erase. Gets messy quick.
Supplemental:
- Mathematics for Topcoders
- Dynamic Programming – From Novice to Advanced
- MIT Interview Materials
- Exercises for getting better at a given language
Read and Do Programming Problems (in this order):
- Programming Interviews Exposed: Secrets to Landing Your Next Job, 2nd Edition
- answers in C, C++ and Java
- Cracking the Coding Interview, 6th Edition
- answers in Java
See Book List above
Ejercicios de codificación/Desafíos
Once you've learned your brains out, put those brains to work. Take coding challenges every day, as many as you can.
Coding Interview Question Videos:
Challenge sites:
- LeetCode
- TopCoder
- Project Euler (math-focused)
- Codewars
- HackerEarth
- HackerRank
- Codility
- InterviewCake
- Geeks for Geeks
- InterviewBit
- Sphere Online Judge (spoj)
Challenge repos:
Mock Interviews:
- Gainlo.co: Mock interviewers from big companies
- Pramp: Mock interviews from/with peers
- Refdash: Mock interviews
Una vez cerca de la entrevista
- Cracking The Coding Interview Set 2 (videos):
Su CV
- See Resume prep items in Cracking The Coding Interview and back of Programming Interviews Exposed
Pensando en cuando llegue la entrevista
Think of about 20 interview questions you'll get, along with the lines of the items below. Have 2-3 answers for each. Have a story, not just data, about something you accomplished.
- Why do you want this job?
- What's a tough problem you've solved?
- Biggest challenges faced?
- Best/worst designs seen?
- Ideas for improving an existing product.
- How do you work best, as an individual and as part of a team?
- Which of your skills or experiences would be assets in the role and why?
- What did you most enjoy at [job x / project y]?
- What was the biggest challenge you faced at [job x / project y]?
- What was the hardest bug you faced at [job x / project y]?
- What did you learn at [job x / project y]?
- What would you have done better at [job x / project y]?
Preguntas para el entrevistador
Some of mine (I already may know answer to but want their opinion or team perspective):
- How large is your team?
- What does your dev cycle look like? Do you do waterfall/sprints/agile?
- Are rushes to deadlines common? Or is there flexibility?
- How are decisions made in your team?
- How many meetings do you have per week?
- Do you feel your work environment helps you concentrate?
- What are you working on?
- What do you like about it?
- What is the work life like?
Una vez obtenido el empleo
Congratulations!
Keep learning.
You're never really done.
*****************************************************************************************************
*****************************************************************************************************
Everything below this point is optional.
By studying these, you'll get greater exposure to more CS concepts, and will be better prepared for
any software engineering job. You'll be a much more well-rounded software engineer.
*****************************************************************************************************
*****************************************************************************************************
Libros adicionales
- The Unix Programming Environment
- an oldie but a goodie
- The Linux Command Line: A Complete Introduction
- a modern option
- TCP/IP Illustrated Series
- Head First Design Patterns
- a gentle introduction to design patterns
- Design Patterns: Elements of Reusable Object-Oriented Software
- aka the "Gang Of Four" book, or GOF
- the canonical design patterns book
- UNIX and Linux System Administration Handbook, 4th Edition
Aprendizaje adicional
These topics will likely not come up in an interview, but I added them to help you become a well-rounded software engineer, and to be aware of certain technologies and algorithms, so you'll have a bigger toolbox.
-
Compiladores
-
Emacs y Vi(m)
- Familiarize yourself with a unix-based code editor
- vi(m):
- emacs:
-
Unix: Herramientas para la línea de comandos
-
Teoría de la información (videos)
- Khan Academy
- more about Markov processes:
- See more in MIT 6.050J Information and Entropy series below.
-
Código de paridad y Hamming (videos)
- Intro
- Parity
- Hamming Code:
- Error Checking
-
Entropía
- also see videos below
- make sure to watch information theory videos first
- Information Theory, Claude Shannon, Entropy, Redundancy, Data Compression & Bits (video)
-
Criptografía
- also see videos below
- make sure to watch information theory videos first
- Khan Academy Series
- Cryptography: Hash Functions
- Cryptography: Encryption
-
Compression
- make sure to watch information theory videos first
- Computerphile (videos):
- Compressor Head videos
- (optional) Google Developers Live: GZIP is not enough!
-
Seguridad informática
-
Garbage collection
-
Programación en paralelo - Coursera (Scala)
-
Sistemas de mensajería, serialización y colas
-
A*
-
Transformada rápida de Fourier
-
Bloom Filter
- Given a Bloom filter with m bits and k hashing functions, both insertion and membership testing are O(k)
- Bloom Filters
- Bloom Filters | Mining of Massive Datasets | Stanford University
- Tutorial
- How To Write A Bloom Filter App
-
HyperLogLog
-
Locality-Sensitive Hashing
- used to determine the similarity of documents
- the opposite of MD5 or SHA which are used to determine if 2 documents/strings are exactly the same.
- Simhashing (hopefully) made simple
-
van Emde Boas Trees
-
Estructuras de datos aumentadas
-
Árboles de búsqueda equilibrada
-
Know least one type of balanced binary tree (and know how it's implemented):
-
"Among balanced search trees, AVL and 2/3 trees are now passé, and red-black trees seem to be more popular. A particularly interesting self-organizing data structure is the splay tree, which uses rotations to move any accessed key to the root." - Skiena
-
Of these, I chose to implement a splay tree. From what I've read, you won't implement a balanced search tree in your interview. But I wanted exposure to coding one up and let's face it, splay trees are the bee's knees. I did read a lot of red-black tree code.
- splay tree: insert, search, delete functions If you end up implementing red/black tree try just these:
- search and insertion functions, skipping delete
-
I want to learn more about B-Tree since it's used so widely with very large data sets.
-
AVL trees
- In practice: From what I can tell, these aren't used much in practice, but I could see where they would be: The AVL tree is another structure supporting O(log n) search, insertion, and removal. It is more rigidly balanced than red–black trees, leading to slower insertion and removal but faster retrieval. This makes it attractive for data structures that may be built once and loaded without reconstruction, such as language dictionaries (or program dictionaries, such as the opcodes of an assembler or interpreter).
- MIT AVL Trees / AVL Sort (video)
- AVL Trees (video)
- AVL Tree Implementation (video)
- Split And Merge
-
Splay trees
- In practice: Splay trees are typically used in the implementation of caches, memory allocators, routers, garbage collectors, data compression, ropes (replacement of string used for long text strings), in Windows NT (in the virtual memory, networking and file system code) etc.
- CS 61B: Splay Trees (video)
- MIT Lecture: Splay Trees:
- Gets very mathy, but watch the last 10 minutes for sure.
- Video
-
Red/black trees
- these are a translation of a 2-3 tree (see below)
- In practice: Red–black trees offer worst-case guarantees for insertion time, deletion time, and search time. Not only does this make them valuable in time-sensitive applications such as real-time applications, but it makes them valuable building blocks in other data structures which provide worst-case guarantees; for example, many data structures used in computational geometry can be based on red–black trees, and the Completely Fair Scheduler used in current Linux kernels uses red–black trees. In the version 8 of Java, the Collection HashMap has been modified such that instead of using a LinkedList to store identical elements with poor hashcodes, a Red-Black tree is used.
- Aduni - Algorithms - Lecture 4 (link jumps to starting point) (video)
- Aduni - Algorithms - Lecture 5 (video)
- Black Tree
- An Introduction To Binary Search And Red Black Tree
-
2-3 search trees
- In practice: 2-3 trees have faster inserts at the expense of slower searches (since height is more compared to AVL trees).
- You would use 2-3 tree very rarely because its implementation involves different types of nodes. Instead, people use Red Black trees.
- 23-Tree Intuition and Definition (video)
- Binary View of 23-Tree
- 2-3 Trees (student recitation) (video)
-
2-3-4 Trees (aka 2-4 trees)
- In practice: For every 2-4 tree, there are corresponding red–black trees with data elements in the same order. The insertion and deletion operations on 2-4 trees are also equivalent to color-flipping and rotations in red–black trees. This makes 2-4 trees an important tool for understanding the logic behind red–black trees, and this is why many introductory algorithm texts introduce 2-4 trees just before red–black trees, even though 2-4 trees are not often used in practice.
- CS 61B Lecture 26: Balanced Search Trees (video)
- Bottom Up 234-Trees (video)
- Top Down 234-Trees (video)
-
N-ary (K-ary, M-ary) trees
- note: the N or K is the branching factor (max branches)
- binary trees are a 2-ary tree, with branching factor = 2
- 2-3 trees are 3-ary
- K-Ary Tree
-
B-Trees
- fun fact: it's a mystery, but the B could stand for Boeing, Balanced, or Bayer (co-inventor)
- In Practice: B-Trees are widely used in databases. Most modern filesystems use B-trees (or Variants). In addition to its use in databases, the B-tree is also used in filesystems to allow quick random access to an arbitrary block in a particular file. The basic problem is turning the file block i address into a disk block (or perhaps to a cylinder-head-sector) address.
- B-Tree
- Introduction to B-Trees (video)
- B-Tree Definition and Insertion (video)
- B-Tree Deletion (video)
- MIT 6.851 - Memory Hierarchy Models (video) - covers cache-oblivious B-Trees, very interesting data structures - the first 37 minutes are very technical, may be skipped (B is block size, cache line size)
-
-
k-D Trees
- great for finding number of points in a rectangle or higher dimension object
- a good fit for k-nearest neighbors
- Kd Trees (video)
- kNN K-d tree algorithm (video)
-
Skip lists
- "These are somewhat of a cult data structure" - Skiena
- Randomization: Skip Lists (video)
- For animations and a little more detail
-
Flujos de red
-
Disjoint Sets & Union Find
-
Matemáticas para procesamiento rápido
-
Treap
- Combination of a binary search tree and a heap
- Treap
- Data Structures: Treaps explained (video)
- Applications in set operations
-
Programación Lineal (videos)
-
Geometría, casco convexo (videos)
-
Matemáticas discretas
- see videos below
-
Machine Learning
- Why ML?
- Google's Cloud Machine learning tools (video)
- Google Developers' Machine Learning Recipes (Scikit Learn & Tensorflow) (video)
- Tensorflow (video)
- Tensorflow Tutorials
- Practical Guide to implementing Neural Networks in Python (using Theano)
- Courses:
- Great starter course: Machine Learning - videos only - see videos 12-18 for a review of linear algebra (14 and 15 are duplicates)
- Neural Networks for Machine Learning
- Google's Deep Learning Nanodegree
- Google/Kaggle Machine Learning Engineer Nanodegree
- Self-Driving Car Engineer Nanodegree
- Metis Online Course ($99 for 2 months)
- Resources:
--
Detalles adicionales de ciertos temas
I added these to reinforce some ideas already presented above, but didn't want to include them
above because it's just too much. It's easy to overdo it on a subject.
You want to get hired in this century, right?
-
Union-Find
-
More Dynamic Programming (videos)
- 6.006: Dynamic Programming I: Fibonacci, Shortest Paths
- 6.006: Dynamic Programming II: Text Justification, Blackjack
- 6.006: DP III: Parenthesization, Edit Distance, Knapsack
- 6.006: DP IV: Guitar Fingering, Tetris, Super Mario Bros.
- 6.046: Dynamic Programming & Advanced DP
- 6.046: Dynamic Programming: All-Pairs Shortest Paths
- 6.046: Dynamic Programming (student recitation)
-
Advanced Graph Processing (videos)
-
MIT Probability (mathy, and go slowly, which is good for mathy things) (videos):
-
String Matching
- Rabin-Karp (videos):
- Knuth-Morris-Pratt (KMP):
- Boyer–Moore string search algorithm
- Coursera: Algorithms on Strings
- starts off great, but by the time it gets past KMP it gets more complicated than it needs to be
- nice explanation of tries
- can be skipped
-
Sorting
- Stanford lectures on sorting:
- Shai Simonson, Aduni.org:
- Steven Skiena lectures on sorting:
Series de videos
Sit back and enjoy. "Netflix and skill" :P
-
List of individual Dynamic Programming problems (each is short)
-
Excellent - MIT Calculus Revisited: Single Variable Calculus
-
Computer Science 70, 001 - Spring 2015 - Discrete Mathematics and Probability Theory
-
CSE373 - Analysis of Algorithms (25 videos)
-
UC Berkeley CS 152: Computer Architecture and Engineering (20 videos)
-
Carnegie Mellon - Computer Architecture Lectures (39 videos)
-
MIT 6.042J: Mathematics for Computer Science, Fall 2010 (25 videos)
-
MIT 6.050J: Information and Entropy, Spring 2008 (19 videos)